Gene Tery_4125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4125
Symbol
ID	4245639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	6363768
End bp	6364736
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	32%
IMG OID	638109026
Product	glycosyl transferase family protein
Protein accession	YP_723606
Protein GI	113477545
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGATT TTACTATTGC AATTCCTACT TACAATGGCG CAGAAAAATT ACCATTAGTT 
CTAGAAAAAC TAAATTCTCA AATCAATACA GAGAAATTAT CGTGGGAAGT AATTGTTGTA 
GACAATAACA GCCAAGATAA TACAGAACAA GTCATTAGAG AATATCAAAA AAACTGGCAT 
CAAGAAAATA GATTAAAATA TTTTTTTGAG GAGAAACAAG GAGCAGGTTT TGCTAGAAAA 
AAGGCTGTTC AAGTAGCAAT TTCTCCTTTA ATTGGTTTTC TAGATGATGA TAATATTCCT 
GCAGAAAATT GGGTTGCAGC AGCTTATGAG TTTGCTCAAA AATATCCCAA AGCAGGTGCT 
TATGCTAGTC AAATACATGG AGATTTTGAG GGAAAATTAC CTCCTAATTT TAATCGAATT 
CAACCATTTT TTGCTATTAC TGAAAGGGGG GGTAAACCAT TACTATATAA ACCTAAATCA 
AAAGTAATAC CTCCGTCCGC AGGATTAGTA ATTCGGAAGA AAGCTTGGTT AGAAAGTGTT 
CCAAAGCACT GTATTTTGAG TGGTAGAAAA CCAGGTTCAA TGTTAACAGG TGAGGATACA 
GAAACTATTG GTTATATTCA ACAAGCAGGT TGGGAAATTT GGTATAATCC GAGCATGGAG 
GTAACTCACA AAATTCCTAA AAATAGATTG GAAAAAGATT ATTTAATTAG TTTTTTCTGT 
GGTATTGGTT TGAGTCGTTA TGTAACTCGA ATGTTAGGGG TTAAGTCTTG GTTAAAACAA 
TTAGTTTTAT TGGCTTATAT GGCTAATGAT ACTCGGAAAA TTATCTGTCA TTTACTTAAA 
TATAATTTAA AGTTAGGAAC AGATCTAGTA GCAGCTTGTG AATTAGAGTT ATATATTAAT 
AGTTTAATTA GTCCTTTTTA TCTGTGGAAA AATGGTTATT TCGCAGATTT AGAAAAAAAT 
CAATATTAA

Protein sequence

MIDFTIAIPT YNGAEKLPLV LEKLNSQINT EKLSWEVIVV DNNSQDNTEQ VIREYQKNWH 
QENRLKYFFE EKQGAGFARK KAVQVAISPL IGFLDDDNIP AENWVAAAYE FAQKYPKAGA 
YASQIHGDFE GKLPPNFNRI QPFFAITERG GKPLLYKPKS KVIPPSAGLV IRKKAWLESV 
PKHCILSGRK PGSMLTGEDT ETIGYIQQAG WEIWYNPSME VTHKIPKNRL EKDYLISFFC 
GIGLSRYVTR MLGVKSWLKQ LVLLAYMAND TRKIICHLLK YNLKLGTDLV AACELELYIN 
SLISPFYLWK NGYFADLEKN QY