Gene Tery_2749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_2749
Symbol
ID	4244782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	4257314
End bp	4258822
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	38%
IMG OID	638107808
Product	glycosyl transferase family protein
Protein accession	YP_722405
Protein GI	113476344
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.924892
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.61972
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGACA GTTATTTACC CAAAGACAGT TACTATCAGG AAACCAAAAT TTATCAAAAC 
GATACCTCAG ATAATGAACA GGAAAATTAT CAGGTATCAG AAAGGCAGAA AACTTTAGAT 
GTTAACCAGA TAGAGCAAAA AATAGAAGTG GTGGAGAAAA AAAAGTTTCA GGATATTTAT 
GATGGTCGTA GATGTAAAGC AGCACTTATG CTATGGCTTA TCTGGACTAC TACTATTATC 
CTACATTTGC TTTCGTGGGG ATATTGGATA ATTCTGGGTT TGACAGGTTT ACTGTCAGTT 
CAATTTTTGA GAATACTATT TGCTAAACCA AAATTAGCTC CAAAAACTCT GTCAGAAGAA 
AATTTTACTG AATGGCCTTA TATATCTCTG TTAGTAGCCG CTAAAAACGA AGAAGCTGTA 
ATCAGAAAGT TGGTAAAAAA TATGCTGGCT TTAGATTATC CTACTAATAG TTATGAACTT 
TGGGTGATAG ATGACAATAG TACGGATAAA ACCCCTTTAT TATTAGAACA ATTGGCCCGG 
GAATATGAAC AGCTAAAAGT GATTAGAAGA AGTCCAGATG CTGGGGGTGG TAAGTCAGGG 
GCTCTAAATG CTGCTATACC TTTTGTGAAG GGAAAAATTT TAGGAGTATT TGATGCAGAT 
GCACAAGTAA CACCAGATCT ACTCCAAAAG GTAGTACCAC TTTTTGCTAG GGAAGAAGTA 
GGAGCAGTAC AAATCAGAAA GGCGATCGCT AATGCAGGTA TAAACTTTTG GACGAAGGGA 
CAATCAGCAG AAATGGTTGT GGATGGTTTT TTTCAGGAAC AGCGAATTGC CATTGGCGGG 
ATTGGAGAGC TCAGAGGAAA TGGCCAGTTT GTACGAATGA ATGCTCTGGA AGAATGTGGA 
GGGTGGAATG AACAGACTAT TACTGATGAT TTAGATTTAA CTATTCGCCT ACACTTAAAC 
CAATGGGATA TAGATTATCT GGCTTTTCCG GCAGTAACGG AGGAGGGAGT AACTAGCCCT 
ATAGCTTTGT GGCATCAACG CTCGCGATGG GCAGAAGGAG GATATCAACG GTATTTAGAC 
TACTGGAAAT TGATTTTGCG TAACCGGATG AGATTTAGTA AAACTTGGGA TTTATGGCAA 
TTTTTGGTAA CACAATATCT ATTATCAGTT GCTGCTGTGC CTGATTTTTT AATGTCAATA 
ATCTTACGTC GTTTACCAAT AACAAGTCCT TTAACTGTGT TTACTGTTAT GGTCTCTTTG 
CTAGGTATGT TTATAGGTTT ACGCCGAACT CGGAAACAAC AGATGAACTT AGCAAAGGAG 
GAAAAGGTGA TGGAGTTTAA TTCGAGTAAA GATAATCCAT TGTCTTTATT TCTAACTTTA 
CTAGAAAGTG TGCGGGGAAC TTTTTATATG TTGCATTGGT TTGTAGTTAT GGGTGTTACT 
ATTGCTCGAA TGTCTATATT ACCCAAGAGA CTAAAATGGG TAAAAACAGT TCATAGAGGT 
GATGAATAA

Protein sequence

MPDSYLPKDS YYQETKIYQN DTSDNEQENY QVSERQKTLD VNQIEQKIEV VEKKKFQDIY 
DGRRCKAALM LWLIWTTTII LHLLSWGYWI ILGLTGLLSV QFLRILFAKP KLAPKTLSEE 
NFTEWPYISL LVAAKNEEAV IRKLVKNMLA LDYPTNSYEL WVIDDNSTDK TPLLLEQLAR 
EYEQLKVIRR SPDAGGGKSG ALNAAIPFVK GKILGVFDAD AQVTPDLLQK VVPLFAREEV 
GAVQIRKAIA NAGINFWTKG QSAEMVVDGF FQEQRIAIGG IGELRGNGQF VRMNALEECG 
GWNEQTITDD LDLTIRLHLN QWDIDYLAFP AVTEEGVTSP IALWHQRSRW AEGGYQRYLD 
YWKLILRNRM RFSKTWDLWQ FLVTQYLLSV AAVPDFLMSI ILRRLPITSP LTVFTVMVSL 
LGMFIGLRRT RKQQMNLAKE EKVMEFNSSK DNPLSLFLTL LESVRGTFYM LHWFVVMGVT 
IARMSILPKR LKWVKTVHRG DE