Gene Tery_0459 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_0459
Symbol
ID	4243753
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	727178
End bp	728614
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	35%
IMG OID	638105776
Product	PUCC protein
Protein accession	YP_720390
Protein GI	113474329
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.222585
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAGTA AAGATTTAAA AGGTACAAAA ATCGATAATA TTGATATGGA AAAAAATTTT 
CCTAAACTTA ATTTATTCAC TATGTTTAGA TTGGGTTTCT ATCAAATGGG ATTAGGAACA 
ATGTCAGTTT TAACTCTTGG AGTTTTAAAC CGAGTTATGA TTGCTGAATT AAAAATTCCT 
GCCACAATAG TAGCCATAAC TTTATCGTTA TATCAATTTA TGGCTCCAGC AAGGGTTTGG 
TTTGGTCAAA TGTCTGATAC TAAGCCTTTG CTTGGTAAAC ATCGCACTGG TTATATGTGG 
ATAGGAGCGG TTTTTTTTAC GGTAACTGCT TTTTTTGCTG TGCAAGCTAT GTGGCAGGTT 
GGTGATAGTT TAAGGGTTAA TGGTTGGTCT AATTCTACTT ATTTTTGGAT TGGTATTTTA 
GGCTTAATGT TTATATTTTA TGGTTTGGCT TTAAGTGCAA GTTCTACACC TTTTGCTGCT 
TTATTAGTAG ATATTTCTGA TGAAGATAAT CGTTCTAAGG TTGTCGGTAT AGTCTGGTCA 
ATGTTGATGG TGGGAATTAT TATTGGGGCT ATTACTAGTA GTTTTTTATT GAAACAAGTT 
GGTGTGGATG CTCCGTTAGA AACTGTTCAA GTTTCTATTA ATAATTTGTT TATTATAATA 
CCGGCAATTG TTTTGGTTTT TGCTTTTATT GGTACTGTGG GAGTTGAGGA AAAATACTCT 
CGTTATGGCA GTCGTTCAAC TATTGCTAAC CGGGAGGATC AAGTTACTAT GGGAACAACT 
TTAAAAATTT TAAAGGCTAA TAGACAAACT GGTTTGTTTT TTACTTTTGT GTTTGTATTA 
ATTATTAGTT TGTTTATGCA GGATGCTGTT TTGGAGCCTT ATGCTGGGGA AATATTTCTG 
ATGCCAATTT CTGAAAGTAC TAGGTTGAAT GCTGTTTCGG GAATAGGAAC TTTAATTGGG 
TTAGGTACAA CGGGTTTTTT AGTAGTACCA AGGTTGGGAA AGAAAAATTC TTTGAAGGTT 
GGATGTGTGG CAACAACAAT TAGTTTTATT TTGATAGTTA TGTCTGGGTT TACTGGTAAG 
CTTTCTTTGT TTTTAAGTGC TTTATTTTTG TATGGTTTGG CTGCAGGTTT AACTACTACT 
GCTGCTCTTA GTTTAATGTT AGATTTAACG GCGGCGGAAA CGGCGGGAAC TTTTATTGGG 
GCTTGGGGTT TAGCACAGGC AATGGCACGA GGTTTATCTA CGGTTATTGG TGGTGTGACT 
TTGGATGTTG GTCGCCGTTT ATTTAATGTT TCAATGTTGG CTTATGGGTT GGTTTTTCTA 
TTAGCAGGAG TGGGAATGAT ACTTTCTATT TTCTTGCTCA ATAGGGTTAA TGTTAGAGAA 
TTTCAAGATA ATGCTAGTGT GGCGATCGCT ACTATTTTAG AGGGAGAATT AGATTAG

Protein sequence

MTSKDLKGTK IDNIDMEKNF PKLNLFTMFR LGFYQMGLGT MSVLTLGVLN RVMIAELKIP 
ATIVAITLSL YQFMAPARVW FGQMSDTKPL LGKHRTGYMW IGAVFFTVTA FFAVQAMWQV 
GDSLRVNGWS NSTYFWIGIL GLMFIFYGLA LSASSTPFAA LLVDISDEDN RSKVVGIVWS 
MLMVGIIIGA ITSSFLLKQV GVDAPLETVQ VSINNLFIII PAIVLVFAFI GTVGVEEKYS 
RYGSRSTIAN REDQVTMGTT LKILKANRQT GLFFTFVFVL IISLFMQDAV LEPYAGEIFL 
MPISESTRLN AVSGIGTLIG LGTTGFLVVP RLGKKNSLKV GCVATTISFI LIVMSGFTGK 
LSLFLSALFL YGLAAGLTTT AALSLMLDLT AAETAGTFIG AWGLAQAMAR GLSTVIGGVT 
LDVGRRLFNV SMLAYGLVFL LAGVGMILSI FLLNRVNVRE FQDNASVAIA TILEGELD