Gene Tery_3140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3140
Symbol
ID	4244270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	4795204
End bp	4796496
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	29%
IMG OID	638108150
Product	sulfotransferase
Protein accession	YP_722743
Protein GI	113476682
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.615346
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.169437
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATT TTTCCCAAAA GAATTTAATA TTTCTTATTT CACAACCCAG AGCAGGATCA 
ACTCTTACTC AACGTATTTT GGGTAGTCAT CAAGATATTC ATACTATATC TGAACCTTGG 
ATTATGTTAC ATCCTTTCTA TGCACTGCGT GATAAGGGGT GTCAAATGGA GTATAGTGCA 
GTTAATAGTA AAAAAGGACT TAATAACTTT CTATGGTTAC ATCCTCAAGG GGAAGAAGCA 
TATTTTCAGT CAGTAAATAA AATGTGTCTT AATTTATATG AGGGAGTTAT CAAGGAATCT 
GGCAAAAAAT ATTTCTTAGA TAAAACGCCA AGATACTATT ATATTTTGCC TGAGTTGTAC 
AGAACTTTTC CTTCTGCTAA ATATATTTTT TTATTAAGAA ATCCCTTAGC TGTTTTATGT 
TCTATTTTTA ATACTTTTAT TCAAGAACAT TGGTGGAGAA TCCAATATTA TCAAGGTGAT 
CTTTTAAAAG CACCTATTTT AATTGCTCAA GGAATGGTTG AATTACAAAA CAAGAGTATT 
GTGCTCAGCT ATGAACATTT ACTCGTTAAT CCTAATCAGG AAATCAAAAA AGTTTGTAAA 
TTTCTTAATA TTCCTTTTGA TGAGAAAATA TTAAATTATG GTGAGAGTTC CTCACAGAAA 
TGGGAATTTG GAGATCAATC TCAAATTTAT CAAGAAAAAA CTCCTAATTC TCAACATAGA 
GATCGTTGGA AAAAAGATTT AGATAACCCG ATTATTTGGC AATGTGTATC TAATTATTTA 
GAGTTTTTAG GAAATGATCT TCTTAATAGT TTAGGTTATT CTTATGAAGA AGTTAAAAAT 
ATTCTTTCTG ATTATAGTTA TCAAACTAAC ATAGTTTTAC CTCCTGCTCT GAAGGATTTT 
TTTACTAGTG CAAATCTTTT TAAAAATAAA GCTTTACAAC CTTATTTAGA AGCAGTGGAA 
TTAAACCCCC AAATATTCCA CCCTTATCTA GATCTTGGCA AAGCATTATT AGAAAAAAAA 
GATTTTAAAA AAGCTCTTAA TTATCTACAA ATAGCTTTAA AATTAGCTCC TTATATACCA 
GAAATTCATT TTTTAATAGG AGAAAATCTT TTAGGTTTAG GTGAATTAGA TCAAGCTATT 
ATTTATTATC AAAAAACTAT TGATTTAGAC TTTAGATTTG TCAAAAATTA TGATAAGATA 
GAATCTACAA TAATGGCTCT TAAAGAAGTC GCTCAAGTTA ATCCAAATCA TCAGGAGATC 
GCTAATTTAA TCAAAACAAT AACAAATATT TGA

Protein sequence

MSDFSQKNLI FLISQPRAGS TLTQRILGSH QDIHTISEPW IMLHPFYALR DKGCQMEYSA 
VNSKKGLNNF LWLHPQGEEA YFQSVNKMCL NLYEGVIKES GKKYFLDKTP RYYYILPELY 
RTFPSAKYIF LLRNPLAVLC SIFNTFIQEH WWRIQYYQGD LLKAPILIAQ GMVELQNKSI 
VLSYEHLLVN PNQEIKKVCK FLNIPFDEKI LNYGESSSQK WEFGDQSQIY QEKTPNSQHR 
DRWKKDLDNP IIWQCVSNYL EFLGNDLLNS LGYSYEEVKN ILSDYSYQTN IVLPPALKDF 
FTSANLFKNK ALQPYLEAVE LNPQIFHPYL DLGKALLEKK DFKKALNYLQ IALKLAPYIP 
EIHFLIGENL LGLGELDQAI IYYQKTIDLD FRFVKNYDKI ESTIMALKEV AQVNPNHQEI 
ANLIKTITNI