Gene CHU_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CHU_1047
Symbol
ID	4184383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cytophaga hutchinsonii ATCC 33406
Kingdom	Bacteria
Replicon accession	NC_008255
Strand	+
Start bp	1207878
End bp	1209344
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	40%
IMG OID	638071045
Product	sodium/solute symporter
Protein accession	YP_677664
Protein GI	110637457
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.322443
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.451489
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCTC AATTAATTAT TACAATATTA GGAGTGTATT TCGCTGCTTT ACTGCTGATT 
GCCTGGTTTA CGTCCAGAAA TGCAGATTCA GATGCTTTTT TTACAGGAAA TAATCAATCT 
GCCTGGTATC TGGTAGCTTT TGGTATGATC GGCACTTCGG TTTCAGGAGT AACATTCATT 
TCCGTACCGG GACAGGTTGC CGCACAGGGT TTTTCGTATT TTCAGCTCAT ATTGGGCAAT 
ATGTTTGGAT ATTTTGTAGT AGCAGCCGTT TTGATGCCTA TTTACTATAA ATCGAACATG 
GTTTCCATTT ATACCTTTTT AGAAGAACGG TTTGGATTCT GGTCCTACAA AACCGGTTCT 
GCATTTTTCT TATTATCCCG TACAATCGGG TCTTCGCTTC GCCTGTATCT GGCAGCAGAA 
GTATTACATA CGTTTCTGTT CCGTGAGCTG GGTGTTTCAT TTATTGTTAC GGTTGGTGTT 
ACCATTCTGC TGATCTGGGT GTATACATTT AAGGGCGGCG TTAAAACCAT TATCTGGACA 
GACACCTTTC AAACGTTCTT TCTGGTAGGT GCTGTTATCA TCAGTGTTGT TGTTATTTCA 
AACCAGTTAG GCTGGGGTAC GGTTGAAATG ATCAAAGAAG TAGATGCAAG TAAATATTCT 
ACCATCTTTC ACTTTGAAGA CATAAAATCC CCGCAGTATT TCTGGAAACA GTTTATATCG 
GGCATTTTTA TGACGATCGT GCTGACCGGT CTGGATCAGG ATCTGATGCA AAAAAATCTT 
ACCTGTAAAA ATCTGGGTGA AGCACAAAAG AATATGTACT GGTTCTCTGT GATACTGGTA 
GCAGTAAATT TTTTATTCTT AACCTTAGGT GCCTTGCTCT ATATCTATGC AGATCAAAAG 
GGGATAGCAG TTCCTGCACA ATCCGATTTC TTTTATCCGA TTCTTGCCTT AAAATATCTG 
GGTGTAATTG CCGGCGTATT CTTTTTGCTG GGAATAACGG CTTCTTCGTA TGCCAGTTCT 
GACTCAGCAC TGACAGCGCT GACAACCGCA TTCTGTATTG ACTTCCTCAA TTTTAATAAA 
GGCAATGTTG TAAATAAAAA CCGCACACGT ACTTATGTGC ACATAGGTTT TTCTATGCTC 
TTTTTTGTGA TTATTGTTTT GTTCAAAGAA TTCAATGAAG GTACAACGGT TATAAAAACA 
GTATTAAAAG CGGCCGCTTA TACTTATGGT CCGTTGCTGG GCATGTTTGC CTTTGGTATC 
TTCAGCAAGC ACAGAACAGT TACCGATAGA TGGGTTCCTG TTGTATGTAT AGTATCGCCG 
CTGCTGACAT TCCTCGTTGT GCTGTTTATC AAAGAGGTAC TCGGGTATCA GACAGCCTTT 
GAGGACTTGC TCATCAATGG CGCCATAACG ATTATAGGCT TGTTGTGTAT TTCACATGCG 
CCTAAACAAC GCGATGCATT TTCATAA

Protein sequence

MTAQLIITIL GVYFAALLLI AWFTSRNADS DAFFTGNNQS AWYLVAFGMI GTSVSGVTFI 
SVPGQVAAQG FSYFQLILGN MFGYFVVAAV LMPIYYKSNM VSIYTFLEER FGFWSYKTGS 
AFFLLSRTIG SSLRLYLAAE VLHTFLFREL GVSFIVTVGV TILLIWVYTF KGGVKTIIWT 
DTFQTFFLVG AVIISVVVIS NQLGWGTVEM IKEVDASKYS TIFHFEDIKS PQYFWKQFIS 
GIFMTIVLTG LDQDLMQKNL TCKNLGEAQK NMYWFSVILV AVNFLFLTLG ALLYIYADQK 
GIAVPAQSDF FYPILALKYL GVIAGVFFLL GITASSYASS DSALTALTTA FCIDFLNFNK 
GNVVNKNRTR TYVHIGFSML FFVIIVLFKE FNEGTTVIKT VLKAAAYTYG PLLGMFAFGI 
FSKHRTVTDR WVPVVCIVSP LLTFLVVLFI KEVLGYQTAF EDLLINGAIT IIGLLCISHA 
PKQRDAFS