Gene Bphyt_2114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bphyt_2114
Symbol
ID	6282834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia phytofirmans PsJN
Kingdom	Bacteria
Replicon accession	NC_010681
Strand	+
Start bp	2381250
End bp	2382869
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	66%
IMG OID	642621673
Product	Mammalian cell entry related domain protein
Protein accession	YP_001895739
Protein GI	187924097
COG category	[R] General function prediction only
COG ID	[COG3008] Paraquat-inducible protein B
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAGCC CACAAGGACC CGCCCTGCCG CCCGATCTGC CCGATCCCGA TATCGTGCCG 
CGGCGCGGCT GGTTGCCCTC GCTCGTCTGG GTCGTGCCGC TGATCGCGGC GTTGATCGGT 
CTCGCGCTGG TCGTCAGGGC GGTCACGGAG CGCGGCCCGG CAATCACCAT CGTCTTCGAC 
AACGCCGAAG GCCTCGAACC CGGCAAGACC CAGGTCAAGT ACAAGGACGT CGAAATCGGT 
TCGGTGAAGT CGATCACGCT GTCGAAGGAT CGCACGCACG TGCAGATCGC CGTGCAACTC 
ACCAGGCAGG CAGAGAACTT CGCTGTCAAG GACACCCGCT TCTGGGTGGT GCGCCCTCGC 
GTAGGCGCCG CCGGCGTGTC GGGCATCGGC ACACTGCTCT CGGGCGCGTA TATCGGCGTG 
GATGTCGGCC GCTCGACGGA GACGCGAACC GAGTTTGTCG GGCTGGAGAC GCCGCCGCCC 
ATCACCGCCG CCCAGAAAGG CCACCGCTTC ACGTTGCACG GCGATTCGCT CGGCTCGATC 
GATATCGGCT CGCCGATTTT CTACCGGCGC GTGCAGGTGG GTCAGGTCTA CGGCATTTCG 
CTCGACAAGG ACGGCACGGG CGTGACCATG CAGGTGTTCG TCGCCGCGCC GTACGATCAG 
TACGTCGGCT CGAATTCGCG CTGGTGGCAT GCGAGCGGCG TGGACGTGCG GCTCGATTCG 
ACCGGCTTTG TCGTCAACAC GCAGTCGCTT GCGGCGATTC TGGTCGGCGG GCTCGCCTTC 
CAGACGCCGC CAGGTCAGCC GATGGGCACG CCGGCCGCGG AGAAAACCGA CTTCCGGCTC 
GCCGCCGACG AAGTGGACGC CATGCGCGCG CCAGACGGCA TACGGGTACG CACCGTGATG 
GTCTTCAGTC AGTCGCTGCG CGGACTGTCG GTGGGCGCGA CGGTCGACTT CCGGGGCATC 
GTGCTGGGCC AGGTCACGGA CATCGGCGTC GAATACGATC CGCAAGCGCG CAGCTTCGTC 
ATGCCGGTGA CGCTGGATCT GTACCCTGAC CGCCTGCGCC GGCGGTCCCG CGGCGCGGCC 
ATGCCCGAGG CGGGTACCGC GGCCAGCCAC GAACTGTTGC GGCGTCTCGT CGAGCGCGGC 
TTGCGTGGGC AATTGCGCAC CGGCAACCTG CTGACGGGCC AGTTGTACAT CGCGCTCGAC 
ATTTTCCCCA ACGCCGCGCC CGTCAAGTTC GACACCACTA ACGAGCCGAT CCAGCTGCCG 
ACCATTCCAA ACACGCTCGA CGCGTTGCAA ACGCAGGTGG CCGACATCGC GAAGAAGCTC 
GACCGGATTC CGTTCGATCA GCTCGGTTCG AATCTGAACA CGTCGCTTAA AAACGCCGAC 
GCGCTGTTCA ACCGGCTCAA CAACGAAGTC GTGCCGCAGG CGCGCGACAC GCTCGCTGCC 
GCGCGGCAAA CCTTCGGCTC GGCCGAGGCG ACTTTGCAAC AGGACTCGCC GTTGCAGTCC 
GACGTGCATC AGGCGCTGCA GGAGTTGACC CGCACGCTAC GATCGCTGAA CGCGCTAGCC 
GATTATCTGG AGCGCCATCC GGAGTCGCTG GTGCGCGGCA AACCGGGAGA CAAGCCATGA

Protein sequence

MSSPQGPALP PDLPDPDIVP RRGWLPSLVW VVPLIAALIG LALVVRAVTE RGPAITIVFD 
NAEGLEPGKT QVKYKDVEIG SVKSITLSKD RTHVQIAVQL TRQAENFAVK DTRFWVVRPR 
VGAAGVSGIG TLLSGAYIGV DVGRSTETRT EFVGLETPPP ITAAQKGHRF TLHGDSLGSI 
DIGSPIFYRR VQVGQVYGIS LDKDGTGVTM QVFVAAPYDQ YVGSNSRWWH ASGVDVRLDS 
TGFVVNTQSL AAILVGGLAF QTPPGQPMGT PAAEKTDFRL AADEVDAMRA PDGIRVRTVM 
VFSQSLRGLS VGATVDFRGI VLGQVTDIGV EYDPQARSFV MPVTLDLYPD RLRRRSRGAA 
MPEAGTAASH ELLRRLVERG LRGQLRTGNL LTGQLYIALD IFPNAAPVKF DTTNEPIQLP 
TIPNTLDALQ TQVADIAKKL DRIPFDQLGS NLNTSLKNAD ALFNRLNNEV VPQARDTLAA 
ARQTFGSAEA TLQQDSPLQS DVHQALQELT RTLRSLNALA DYLERHPESL VRGKPGDKP