Gene Tery_4188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4188
Symbol
ID	4245840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	6453948
End bp	6455345
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	32%
IMG OID	638109087
Product	extracellular solute-binding protein
Protein accession	YP_723665
Protein GI	113477604
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTACGA AGAGTAAATT ATGTAAATTA ATTGGGTTAT TTATACTTGC TTTAATATTA 
GTTACTTGTA GGGTTAATCC AAATAAGGAT AATATCCAAA AGCCTCAATC AGATCAAGTA 
TTAACAATTT GGTGGAATCG AGGATACTAT CCGGAGCAAG AAGAAGCTCT TAAAAAAGTA 
GTTGTTGACT GGGAGGAAAA AACAAATAAC AAAGTTAAAC TTTTGTTTTT CAGTGAGGAT 
GATATATTAC AAGCAGCTAT TGATGCTTTG GAAGTAGGTA AAACACCTGA TATTCTCTTT 
TCCGAAAGAG CAGAGTTTAC TTTAATTCCC CAGTGGGCTA GAGAAGGAAA ATTAGTAGAT 
GTTTCAGATG TAATTAAGCC TGTAAAAAAA TCCTATGATA CAACTGCACT GAACTCTTCT 
TATTTGTACA ACCAAGTTAA GTCTAAATCT TCTAATTATA CTGTGCCAAT AATGCAGCAA 
ACTCTCCATG TTCATTACTG GCTTGATTTA ATTAGTGAAG CTGGTTTGGG TGAAGAAATA 
CCAGAAGAGT GGGACGAGTT TTGGCAGTTT TGGCAAAAGG CACAAAAAGT TTTGCGTGAA 
AAAGGTCAAG ATAATATTTA TGCTTTAGGT TTGCCTATGT CTATTAATAG TACAGATACT 
TACATTATAT TTAAACAAAT CTTGGAAGCT AACAATTTAC AAATAGTAGA TAAACAGGGA 
AAATTACAAG TCGATAAACC AGAAATAAGA CAAAAAATTA TTGATATTTT AGACTGGTAT 
ACTAGCTTTT ATAAAAATGG GTATGTGCCA CCTAAAGCAG TTAACTGGAG TAATTCTGAT 
AATAATATTA GTTTCCTCAA TCAGAATACT TTAATGACAA TTAATCCAAG TATGTCAATT 
CCTGGTTCTC AACAAGAAGA TGAAGAAATT TACTTAAATA AAATGAGAAC TATAGAGTTT 
CCGAATAATC CTAATGGAGG TGCTCCAACA TATTTAGTAT CTGTCAAAGA ACCTATAATT 
TTTACATCTT CTCCTAATCC ATTATTGGCG AAAAATTTTC TTTCATACTT AGTAAAACCA 
GATAATTTAG GACCTTATAT TAAAGGTGCA AAAGGTCGTT ATTTTCCAAT TATGCCTAAG 
CTCTGGAAAG ACCCTTTTTG GAGTAATATA AAAGATCCCC ATATTTCTGT TGCTTCTCAA 
CAATTTACTA AATCTCAGAC TCGTTTACTT CACAATTCTA TCAACCCAGC TTATTCTCAA 
ATAGATTCAG AAAATATTTG GGGAAAAGCC ATGGCAAAAG TGTTAATTGA AGGCTTATCA 
CCAACTGCTG CAACAGACCA AGCTATTAAT CAAATTAAAG AAATATTTGC TCAGTCAAAA 
ACTCAGAATG AAAGGTAA

Protein sequence

MITKSKLCKL IGLFILALIL VTCRVNPNKD NIQKPQSDQV LTIWWNRGYY PEQEEALKKV 
VVDWEEKTNN KVKLLFFSED DILQAAIDAL EVGKTPDILF SERAEFTLIP QWAREGKLVD 
VSDVIKPVKK SYDTTALNSS YLYNQVKSKS SNYTVPIMQQ TLHVHYWLDL ISEAGLGEEI 
PEEWDEFWQF WQKAQKVLRE KGQDNIYALG LPMSINSTDT YIIFKQILEA NNLQIVDKQG 
KLQVDKPEIR QKIIDILDWY TSFYKNGYVP PKAVNWSNSD NNISFLNQNT LMTINPSMSI 
PGSQQEDEEI YLNKMRTIEF PNNPNGGAPT YLVSVKEPII FTSSPNPLLA KNFLSYLVKP 
DNLGPYIKGA KGRYFPIMPK LWKDPFWSNI KDPHISVASQ QFTKSQTRLL HNSINPAYSQ 
IDSENIWGKA MAKVLIEGLS PTAATDQAIN QIKEIFAQSK TQNER