Gene Tery_2856 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_2856
Symbol
ID	4244927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	4447185
End bp	4448186
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	40%
IMG OID	638107906
Product	glycosyl transferase family protein
Protein accession	YP_722503
Protein GI	113476442
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAACCA CTACTACCAC TCCACGGGTA AGTGTAATTA TACCCGTATA CAATTGCGAT 
CGCTATATTA ATCAAGCTAT AGAAAGCATT TTCGCCCAAA CCTATCAATC TTATGAAATT 
ATTGTAATTG ATGATGGCTC CACAGACAAT ACCCGCAAGA CCATGGAACC TTATATGGAG 
ATGATCCATT ATGTATATCA ACAAAATCAA GGGGTTTCAG CTGCCCGGAA TCATGGCATT 
AATTTGGCGC GGGGAGAATT AATCGCTTTT TTGGATGCAG ATGATTTTTT CCTACCAGAT 
AAACTGACTG CTCAAGTAAA AGTATTTGAC GCTAAACCAA ATTTAGGAAT TGTTCACAGT 
GGGTGGCGCA GAGTGAATCA GCAGGGTGAA ACTATTAAGG ATGAGACGCC TTGGGATTAT 
GTGCCTAAGT TAAATTTAGA AGGTTGGTTG CGCTGGAAAC CAATTGGCAC AATGGGTACT 
TTGATGTTTC GACGCAGTTG GTTGCAAGAG GTGGGGAGTT TTGAGGTAGG ATTAGGTCAG 
GCTGAGGATG TAGACTTAGT ATTGCGTTTA TCTGTAAAGG GTTGTGAGGC TGAGTGGTTG 
CGACAGTCTA CTATTTGTTA TCGTCAGCAT GACCAGAATA CAATGCGGGA TGGAGTGTCT 
CAGGTGCAAT CTATTAATCG GGTTTTGGAT AAATTTTTTG CCTCGGAGTC TCTACCCTTA 
GAGATTAGGT TATTGGAAAA ACAGTTGCGC TACAATACTT TAGTCTGGTG TTCATGGTAT 
TTGTACTATA CAGGTTTTTC TGCTGAGATG GTGGAATATT TACAAAAGTC TTGGCAGTAT 
ACTCCTTTTT TACCTGTGGG AACGGTAATT AATTGGATTG AAAGTTTTAC AGAATTTTCT 
GAGAATATGG GGGATGATTT GGATGCTGAT AAATTAGGGA AAACTGATGA ATGGCAACAG 
TTAATGGGTT GGGTGATTAG TAATAGTGGG GCTAACTACT GA

Protein sequence

MSTTTTTPRV SVIIPVYNCD RYINQAIESI FAQTYQSYEI IVIDDGSTDN TRKTMEPYME 
MIHYVYQQNQ GVSAARNHGI NLARGELIAF LDADDFFLPD KLTAQVKVFD AKPNLGIVHS 
GWRRVNQQGE TIKDETPWDY VPKLNLEGWL RWKPIGTMGT LMFRRSWLQE VGSFEVGLGQ 
AEDVDLVLRL SVKGCEAEWL RQSTICYRQH DQNTMRDGVS QVQSINRVLD KFFASESLPL 
EIRLLEKQLR YNTLVWCSWY LYYTGFSAEM VEYLQKSWQY TPFLPVGTVI NWIESFTEFS 
ENMGDDLDAD KLGKTDEWQQ LMGWVISNSG ANY