Gene Bind_1800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1800
Symbol
ID	6199864
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	2041165
End bp	2042457
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	55%
IMG OID	641705790
Product	glycosyl transferase family protein
Protein accession	YP_001832917
Protein GI	182678771
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.583334
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAACG CTAAAAAAAT CGTTCTCGCG ACCTTTGGCA CCCTTGGTGA TATTTATCCT 
TTCATTGCCA TCGCTCTGGC AATGAAGGCT CGCGGATTCG CGCCCGTGAT CGCCGCACCG 
GAAATGCATA AGCGTGCAAT AGAAGGAGAG AATATCGCCT TCGTGCTCAT GCGGCCGCAC 
GAAGACGACA TTATACGCGC TCTCGGAGTC GATATTCCCG GCGCGTTCAA GATCATGTTG 
AAAAATCCGT ATTTCATCCT TGATGAAATA TACATGCGGT TTCTATCCGA AACCTATGAC 
GACGTAATGC GTGCTGCCGC TGGCGCTCAC ATCATCATAA CGCACAGCTT GTTGGTCGGA 
GCCCATCAGG CCGCCGAAAA GCTTGGGCTA CCTTGCGCGC GCGTGGCGCT TGCGCCCCTT 
CATTTGCAAT CGGCGGCAGC TCCGTCCTTC ACGCCGTCCG CACCCTATAT TCTCGAGCCG 
AAATCGCGCG CCATTGTGCA CTATAATCGG ATCGTGCGGG CGATCATTCG GCTGAGCATC 
AACATGCGGA TGGGCCGCTT GCGTGCGTTT CGCAAAAAGA TTGGTCTTCC GCCGACACAC 
GAGGATTTCT TTCTCGATTT CGGAAAGGCC AATAAGGCAC AGGCTTTTTT CGGCCTCTTC 
TCACCGCATT TTGCACCGGT ACAGCCGGAT CATCCCCAAA ACATAAGCAC GCCTGGCTTT 
CCTTTTTACA AACCTGCAGA TGCGGATCGA CGCGACCTGG GACCGGGATT GCAAGCCTTT 
CTCTCTGCGG GCGAGCCGCC TATTATTTTT ACTTTGGGCT CTTTCGCGCC CGAAGTCTCT 
GGCGATTTTT ATGATCAGAG CCTTCGCGCC GCACGCTTGC TCGGTCGCCG TGCTATTCTG 
CTGGCGGGTG CAAAGGACGC GACCCGTCTC GCTTCGCGTG TCGGCCCGCA TGAATATGTG 
TGCGAACAGG CTCCTCACAG CCTGTTATTT CCCAAAGGCC TTTGCATCGT CCATCACGGC 
GGCATTGGCA CAACGGCGGA AGCTTTGCGC GCAGGCAAGC CGCAGATCGT GGTTCCCTTC 
TTTGGTGATC AGCCCGACCA TGGAGCGCGC ATCGAAAAGC TGGGGCTCGG CCTCGCCATA 
AAACTGTCCG CCTATGATGA ACGTCGAGCC GCCGCAGCAT TGCAAAGAAT TATCGCCAAG 
GATTATTTCC AAAAAGCGAA AAGCTTCGTG GAACTGATTG AGGCGGAAAA AGGCGTAGAG 
ACGATCGCCG ATTGGGCGGA GAGCCTATTC TAG

Protein sequence

MKNAKKIVLA TFGTLGDIYP FIAIALAMKA RGFAPVIAAP EMHKRAIEGE NIAFVLMRPH 
EDDIIRALGV DIPGAFKIML KNPYFILDEI YMRFLSETYD DVMRAAAGAH IIITHSLLVG 
AHQAAEKLGL PCARVALAPL HLQSAAAPSF TPSAPYILEP KSRAIVHYNR IVRAIIRLSI 
NMRMGRLRAF RKKIGLPPTH EDFFLDFGKA NKAQAFFGLF SPHFAPVQPD HPQNISTPGF 
PFYKPADADR RDLGPGLQAF LSAGEPPIIF TLGSFAPEVS GDFYDQSLRA ARLLGRRAIL 
LAGAKDATRL ASRVGPHEYV CEQAPHSLLF PKGLCIVHHG GIGTTAEALR AGKPQIVVPF 
FGDQPDHGAR IEKLGLGLAI KLSAYDERRA AAALQRIIAK DYFQKAKSFV ELIEAEKGVE 
TIADWAESLF