Gene Bind_2048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_2048
Symbol
ID	6200078
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	2339212
End bp	2340873
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	45%
IMG OID	641706035
Product	glycosyl transferase family protein
Protein accession	YP_001833159
Protein GI	182679013
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCATTT TAGAACATAT TCCGGATTTG GAAAAATGTG TCGCCAAGAT CGATGATCTC 
CTTCGGCCAG ACGGCGTCGC CTATTTGCAG GGTTGTCCCT TATGGGCAGG ATCTCATGGC 
CATCATGTAT GGGTGCTGAA GGAAGAAGGA GATTATGATT CCGAGCTTAC GCCTGAGATT 
GAAAATCGGA CAAACGGACC CCTTTTCAGC TTTGTCGAAA AAGACAAAAA TCCGATACCT 
CATTGGGCGC ATCTTGTTTT GACGCCGGAT AGTCTCACTG AATTTCTGAC AAAAGAAAAT 
GTATCGGAGT CTCATGCACG GAGAATTATC AATTTTGTCT ATAATGTCGA TGGGACGATG 
ATCGGATGCT GCTCGAACTT CAAATCGGCC AGTGAAATCA TCAAGACATT TCAGACAAAA 
TTTATCGTGG ATGCAGAGCG TATTCCAAGT GCTCATCCCA ATGAATATTT TACTGCCGCC 
AGAAAAAAAT ATTCGTATTG GGATTTGCAA ACACATGGCC TGATGCTTTG GCTTAAGCCA 
AAATCATATA TGCTGGAACG CGTCCGGGAA CCTGATCCCA AAGTGTCTGT TATTGTGCCT 
TTCTACAAGG TTGAGGACTA TCTGGGGGAG TGTATCGAAA GCATCATTCG CCAAGATTAT 
AAAAACATCG AAATTATTTT GGTTGATGAC GCTTCTCCCG ATGGCTCCCG TGGGATTGCC 
CAACGTTTTG CGGCAAAGGA TTCAAGGATC CGTGTTCTGA CCCATGAGAA AAACGAAGGC 
CTCGGTCCGG CGAGAAATAC GGGGGTCCAT CATGCGACAG GCTTTTATGT TTTTTTCCTG 
GATTCGGATG ATCTTCTGCA TTCCTCTCAA GCAATTGGTA AACTTGTCTC TGCAGCACAA 
AGCCATAGCA ACTGCCCGGT CGTCGTTGGT GGATGCGTCC GGTTGATGGC CAATGGCAAG 
ATTCAGCCCG TCGATCATAT TGATGATAGA GGCGGCTTAA ATAAATCAGG CGGCGTGGTG 
CATGGCGTCG AAGCGTTTCT CGCAGGTGTG CGATTACCGA ATGCCTATTA TTTGCCACCA 
AGAGCCTGGG GAGCTCTGAT CGAACGAACC TTTTATGAAA ACCTGATGCT AGACTTCCCA 
TCTGGCGAAC ATGAAGATCT TGTTCATACA CCTTTCCTTT ATTTTCTCGC TGACAATGTT 
CTCTATGTAA AAGATATTGT CGTGACTTAT CGATACCGTG ACTGCAGTAT TTCCAATGCG 
CGATGGACAC CGGAAATGGT TCGGCGCTAC GGAGATCTTT GGCGCAATTT TAAATCAATT 
GCTTTGCGTC GTGGGCTTGA AAATTATTTG GGAGATTGCG CATTCAAATT TATTTATCAT 
TTGATTTGGA GAATGCGGAA CAATTCGTTC GATGATGACT CCAGGACAGA GGTCCTTAAC 
TTAGTGGGAA ATATGTTTCA GGATGTAGAG AATGTCACAT ACAAGCATGA GTTTTATCGC 
TCGATGAACT CTGTTCGTAA ATTCGTTGGT GGCACCTTTC GTCGGGATAA ATATTATGAA 
TGGTTGACCA AATCGTTGCC GGAGGACTTA GTTCTGGATT ATTATCGCAA TCATAGTGTT 
TTAGGGCGTT TGTCGTTTGG TCAGTGGTTA CGATGGTTTT GA

Protein sequence

MAILEHIPDL EKCVAKIDDL LRPDGVAYLQ GCPLWAGSHG HHVWVLKEEG DYDSELTPEI 
ENRTNGPLFS FVEKDKNPIP HWAHLVLTPD SLTEFLTKEN VSESHARRII NFVYNVDGTM 
IGCCSNFKSA SEIIKTFQTK FIVDAERIPS AHPNEYFTAA RKKYSYWDLQ THGLMLWLKP 
KSYMLERVRE PDPKVSVIVP FYKVEDYLGE CIESIIRQDY KNIEIILVDD ASPDGSRGIA 
QRFAAKDSRI RVLTHEKNEG LGPARNTGVH HATGFYVFFL DSDDLLHSSQ AIGKLVSAAQ 
SHSNCPVVVG GCVRLMANGK IQPVDHIDDR GGLNKSGGVV HGVEAFLAGV RLPNAYYLPP 
RAWGALIERT FYENLMLDFP SGEHEDLVHT PFLYFLADNV LYVKDIVVTY RYRDCSISNA 
RWTPEMVRRY GDLWRNFKSI ALRRGLENYL GDCAFKFIYH LIWRMRNNSF DDDSRTEVLN 
LVGNMFQDVE NVTYKHEFYR SMNSVRKFVG GTFRRDKYYE WLTKSLPEDL VLDYYRNHSV 
LGRLSFGQWL RWF