Gene Apre_0096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0096
Symbol
ID	8396847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	117514
End bp	118740
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	38%
IMG OID	644994435
Product	sodium:dicarboxylate symporter
Protein accession	YP_003151870
Protein GI	257065614
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000435647
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAA CTAAAAAAAT TGGACTAATT CCAAGAATGA TTCTTGGTAT CTTAGTCGGT 
ATCTTGGTAG GCTTATATCT ACCAATGTGG TTTACAAGAA TCACAGTAAC ATTCTCGTCA 
ATCTTCGGGG CTTTCCTAAA CTTCATAATC CCACTTATGA TTTTAGCTTT CGTTACCAAG 
GGTATAGCAG ACCTAGGCGA GGGGGCAGGT AAGCTTTTAG GAGTAACAGT TTTACTTGCT 
TATATGTCAA CACTAATCGG TGGTTCCTTG TCATATTTTA TGTCAAATGC AATTTTCCCT 
GGCTTTATTT CAGCTGAACA AGTTTCTGCA ATTCAAAGCT CTAACGAAAT TAGCATAGAT 
CCATACTTCG AGGTTCCTAT CACACCATTT TTTGATGTAA CTAGTGCTAT TATCTTTGCT 
TTCATGCTAG GTATCTCAAT ATCTTGGCTA AGAAAGACAA AGCAAGGAGA AATCCTTTAC 
AAGGCAGTTG GTGAATTTAA TATAATAATT ACCAATGTTT TGGCTAAGGC TATCGTTCCA 
CTACTACCAT TTTTCATCTT AGGTAACTTT GCGAAAATGG CAAAATCTGG ATCAGTATTT 
GCAGTATTAT CCATCTTCTG GAAGATATTC ATCTGCGTAA TAGCCCTTCA CTTGATATAT 
GTATCTGTTT TATTTATAAT ATCAGGATCA TATACAGGAA AGAATCCTTT CACTATGCTC 
AAAAATCAAG TAAAAGGTTA CCTAACAGCA GTTGGAACCC AATCATCTGC AGCTACCATT 
CCAGTAAACC TACAATGTGC TGAAAATAAC GGTGTAAGTC GTGAGATCGG TGATTTTGTA 
ATCCCACTAG GTGCAACAGT CCACATGCCA GGTTCAATGA TTACAATCAC TGCTTGTACA 
TTTACAATCC TTACAATGTA CGATATGCCA CACTCTTATG GGCTTATCCT AAGGCTTATA 
GCAATCCTTG GAATTGCAAT GGTTGCAGCA CCAGGAGCAC CAGGTGGAGC GGTAATGAGT 
GCCCTACCAT TCCTACCTGT AGTAGGAATT TCACCAGAAT CAACAATGGC AAGCTTACTA 
ATAACCCTAT ACCTAACCCA AGACTCATTT GGAACAGCTG CCAATATTTC TGGAGACACA 
GCGCTTGCAG TAGCGGTAGA TAAAATTTAT AATAAGAATA TACTAGGTAA AAAAGACTGG 
CAACCAAACC CAGTCAAAAC TAAATAG

Protein sequence

MQKTKKIGLI PRMILGILVG ILVGLYLPMW FTRITVTFSS IFGAFLNFII PLMILAFVTK 
GIADLGEGAG KLLGVTVLLA YMSTLIGGSL SYFMSNAIFP GFISAEQVSA IQSSNEISID 
PYFEVPITPF FDVTSAIIFA FMLGISISWL RKTKQGEILY KAVGEFNIII TNVLAKAIVP 
LLPFFILGNF AKMAKSGSVF AVLSIFWKIF ICVIALHLIY VSVLFIISGS YTGKNPFTML 
KNQVKGYLTA VGTQSSAATI PVNLQCAENN GVSREIGDFV IPLGATVHMP GSMITITACT 
FTILTMYDMP HSYGLILRLI AILGIAMVAA PGAPGGAVMS ALPFLPVVGI SPESTMASLL 
ITLYLTQDSF GTAANISGDT ALAVAVDKIY NKNILGKKDW QPNPVKTK