Gene Tery_1737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_1737
Symbol
ID	4245394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	2643845
End bp	2645032
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	39%
IMG OID	638106862
Product	glycosyl transferase, group 1
Protein accession	YP_721471
Protein GI	113475410
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAATAC TACTAGTCTG CACAGAAAAA TTGCCAGTGC CTTGTATCCG AGGCGGGGCT 
ATTCAGACAT ATATAGATGG TATTCTACCT TTCCTGAAGC GAGATCATGA AGTTACAGTA 
TTCTCTGTAG CTGATCCAGA ACTACCAGAT CAGGAAATTA GGGACAATAT TCTCTATAAA 
CGTTCTAGTA GAAAAACTTC AGAGGAATAC TATCACGCTG TAACCAATTT TGTAGCAGGA 
CGAGAGTTTG ATTGGATAGT AATTTACAAT CGTCCTAAGT ATTTACCAAT GGTGGCTGAA 
GTTGCACCAA ACAGTCGTTT TATACTGAGT ATGCACAATG AAATGTTCCA TGCTAAGAAG 
ATTGAACCTG AAGAAGCAAT TCTATGTTTG GAACGAGTGG AAAAAGTGGT GACAGTTAGT 
AAGTTTATTG CTGATGGAAT AGCTAAATTA TTTCCAGGAT ATGAACATAA GTTAACACCT 
GTATATGCAG GAGTAGACCT AAAGCTCTTT CAGCCTAGGT GGATAGAAGG ATTAGAAGGG 
AAACGAAAAG AAAAGTTGGC GGCTCTGGGT TTAGAAGATA AACAAGTGAT CCTTTATGTG 
GGCAGGTTAA CAGATAAAAA AGGGCCTCAT TTGTTGATAT CTGCTATGAC CAAAGTTATC 
AAGAAACACC CATCTGCTGT ATTATTGCTA GTGGGTAGTA AATGGTATGG TAATAATGAG 
GAAAACGATT ATGTCCGTGA AATTAAGGTC AAGGCTGAAC AATTGGGAGG AGCAGTTCAG 
ATGACTGGTT TTATTCCCCC ATATGAAGTT GCAGATTATT TCTTATTAGG TGATGTATTT 
GTATGTGCAT CTCAATGGGA AGAGCCTCTA GCTAGGGTGC ATTATGAGGC TATGGCAACT 
GGGTTATGTA CTATAACTAC TGGTAGGGGA GGAAACCCGG AAGTAATTAT TCCTGGTAAG 
AATGGTATTG TGATCACAGA CTATGAAAAT TCGGGTGCAT TTGCAGATTG TATAGATTAT 
TTGTTGTCTA TGCCAAACAA GAGAGAAGAA ATGGGGAAAA GAGGGCGTGA GCTAGCGGAG 
CTATATTACA GTTGGTCAAG GGTGGCTTGG GATATTTTAA GTATTATTAA TGATTCAACA 
TCAATGTATT CATCTTCATC TTTAGAAAGA TTCGGACAAA CAGGATAA

Protein sequence

MKILLVCTEK LPVPCIRGGA IQTYIDGILP FLKRDHEVTV FSVADPELPD QEIRDNILYK 
RSSRKTSEEY YHAVTNFVAG REFDWIVIYN RPKYLPMVAE VAPNSRFILS MHNEMFHAKK 
IEPEEAILCL ERVEKVVTVS KFIADGIAKL FPGYEHKLTP VYAGVDLKLF QPRWIEGLEG 
KRKEKLAALG LEDKQVILYV GRLTDKKGPH LLISAMTKVI KKHPSAVLLL VGSKWYGNNE 
ENDYVREIKV KAEQLGGAVQ MTGFIPPYEV ADYFLLGDVF VCASQWEEPL ARVHYEAMAT 
GLCTITTGRG GNPEVIIPGK NGIVITDYEN SGAFADCIDY LLSMPNKREE MGKRGRELAE 
LYYSWSRVAW DILSIINDST SMYSSSSLER FGQTG