Gene Tery_2950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_2950
Symbol
ID	4245292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	4584744
End bp	4585874
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	30%
IMG OID	638107989
Product	glycosyl transferase family protein
Protein accession	YP_722586
Protein GI	113476525
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.268496
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTATAA ACAATTTTCC CAAAGTTACT GTTTGTTTGC CTACTTATAA CTCTGGAGAA 
TTTCTTAGAT ATGCAATAGA CAGTATTCTT GAACAGACAT TTACAGATTT TGAGCTGATT 
ATTTCTGATG ACTGTTCTAC TGATAATACT CCAGAAATTA TTAGGAGTTA TTTGGAGAAA 
GATAGTAGAA TTCAATACTT ACAAAATTCT CACAACTTAG GACTTTTTCC TAATTGGAAT 
CGTTGTTTAG AATCTGCTTC TGGAGAATAT ATTACTGTCT TTGCTCAGGA TGATGTGATG 
TTGCCAAAAA ATTTAGAGCA AAAGGTAAAA ATTCTAGAAA AATACCAAAA TGTTGGTTTA 
GTTACTTCCT CTATTATGGT GGTGGATAGT GATAATAATT ATTTGAATTG GGATTGGGCA 
AATTATGATG AGGATAGCTT AGTTAATGGT GAGGAATGGG TTAAGAAAAA TTTGGGAAAA 
GCTAATCCTA TTTGTTGTCC GTTTGTATTG ATTAGAAGAT ATATTTTAGA AAAAGTTGGT 
GGAAAATTTA ATGACAATTA TCTTTTTGCT GGAGATTTAG AATTATGGTT AAGAATTGCT 
TTGGTTGCTG ATTTGTATTT TGTTAAAGAA ATCTTGGGAT ATTATCGCTG GCATAAAGAA 
AATAAAACTC ATAGTTTTAA TGATTTTGAT CAGGTTAAGG AACATTTACA AATTTGTAGT 
AATTTAATTG ATAGTTTAAA TTTATCAGAT TTAGAATTAA ATTATTGGGA GACTGAGGTG 
TTATCTCGAA CTGTTAAATG GGTTAGTTAT TATCGAATTT ATCGTCATTT AGAAATTTCA 
AATTTTGATG AAGCATTAAA ATTATGTGAG TTACTGGAAA GTTGGCGAGG TAGGTCGGGA 
AAATTAGGTA TTTCTGTGCA GGAATTAGGT ACTAGAATAC AGAAAATTTT GCAAGTAAAT 
TCTCGCCTCC ATTCAGAGAT TAATGAATAT AGTACCTGGG TAAATAATCT TGAGGGAAAA 
AATTCTGCTT TAGAAAGAGA AAAATCTTGG CTAGAATCTC AGGTAAAAGC TTGGATGCAA 
ACTGCACAAA AGTATTATCA TAAAATAAAA GAAAGTGGGA ATTGTTTATA G

Protein sequence

MPINNFPKVT VCLPTYNSGE FLRYAIDSIL EQTFTDFELI ISDDCSTDNT PEIIRSYLEK 
DSRIQYLQNS HNLGLFPNWN RCLESASGEY ITVFAQDDVM LPKNLEQKVK ILEKYQNVGL 
VTSSIMVVDS DNNYLNWDWA NYDEDSLVNG EEWVKKNLGK ANPICCPFVL IRRYILEKVG 
GKFNDNYLFA GDLELWLRIA LVADLYFVKE ILGYYRWHKE NKTHSFNDFD QVKEHLQICS 
NLIDSLNLSD LELNYWETEV LSRTVKWVSY YRIYRHLEIS NFDEALKLCE LLESWRGRSG 
KLGISVQELG TRIQKILQVN SRLHSEINEY STWVNNLEGK NSALEREKSW LESQVKAWMQ 
TAQKYYHKIK ESGNCL