Gene Tery_2067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_2067
Symbol
ID	4245715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	3230557
End bp	3231741
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	36%
IMG OID	638107178
Product	glycosyl transferase, group 1
Protein accession	YP_721781
Protein GI	113475720
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0419406
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.401472
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAATAG TACAAATATT ACCATCTATA TCTCTTGTTT ATGGCGGTCC GAGTCAAATG 
GTTATAGGAC TTTCTACCGC TCTTGCCACT CAGAACATAG ATGTTACCAT TCTCACCACA 
AATTCTAATG GAGACACTGG TCAGCCACCC TTAGATGTTC CTATCAATAA ACCTGTCAAA 
CAAAATGGTT ATCAAATTCG TTATTTTCCT TGTTCTCCGT TTCGTCGTTA TAAATTTTCT 
CTACAATTAT TACAATGGTT AAATGAACAC GCTACTGAAT TTGATTTAGC TCATATTCAT 
GCTCTTTTTT CACCAGTAAC AACCATAGCT GCAACTGTTG CTAGAACCAA TAACTTACCC 
TATATTTTAA GACCATTAGG AACCTTAGAC CCCGCTGATC TACGCAAGAA AAAACAACTC 
AAAAAAATTT ATGTTTCTCT CTTAGAAAAG CGGAATATTG CTCATGCTGC TGCCCTTCAT 
TTTACCACAA CACAAGAGGC AAAAGTTTCC GAAAGATTTG GCTTATCTAC AAAAGACTTA 
GTAATTCCCA ATGGAGTCAA TACTCTAGAG AATATTCAAG ATGAAAATTT AGTTAATAGT 
CTCCGATCTC AAGGAGTAGA AGTGAAACAT CCCATAATTT TATTTATGTC TCGCATTGAA 
CCAAAAAAAG GACTAGATTT ATTATTACCT GCTTTAGAAA AATTGTTAGC ACAAGGGGTA 
GATTTTCAAT TTATCTTAGC AGGTGCAAAT CCTCAAGATC CTAATTATGA GGCACAAATT 
TACTCACAAA TAAAGGCTTC ACCTATTGCT AAGTTTACCA AAATAATGGG GTTTGTTACA 
GGGGAAATAA AGACAAGTTT ATTAAGAATT GCTGATTTAT TTGTACTACC TTCTTATTAT 
GAAAACTTTG GTATTGCAGT AGCAGAGGCT ATGATAGCAG GTACCCCCGT AGTGATTTCA 
GACCAAGTTT ATATTTATCA AGATGTAGCA AATGCAGAAG CAGGTTGGGT TGGTGGTTGC 
AAAACAGAAG ACATGGCTGC TTTAATGAAA TTAGCTTTGC AGGATGAAGC AGAGAGAAAA 
CGCCGGGGTT TGAATGCTCA AGAGTTAGCG AAAAATAATT ATAGTTGGCA AGCGATCGCC 
ACACAAACCA TTCAAGCCTA TGAAAAAATT ATTTCATGTA AATAA

Protein sequence

MRIVQILPSI SLVYGGPSQM VIGLSTALAT QNIDVTILTT NSNGDTGQPP LDVPINKPVK 
QNGYQIRYFP CSPFRRYKFS LQLLQWLNEH ATEFDLAHIH ALFSPVTTIA ATVARTNNLP 
YILRPLGTLD PADLRKKKQL KKIYVSLLEK RNIAHAAALH FTTTQEAKVS ERFGLSTKDL 
VIPNGVNTLE NIQDENLVNS LRSQGVEVKH PIILFMSRIE PKKGLDLLLP ALEKLLAQGV 
DFQFILAGAN PQDPNYEAQI YSQIKASPIA KFTKIMGFVT GEIKTSLLRI ADLFVLPSYY 
ENFGIAVAEA MIAGTPVVIS DQVYIYQDVA NAEAGWVGGC KTEDMAALMK LALQDEAERK 
RRGLNAQELA KNNYSWQAIA TQTIQAYEKI ISCK