Gene Apre_0038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0038
Symbol
ID	8396785
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	46128
End bp	47330
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	38%
IMG OID	644994375
Product	Na+ dependent nucleoside transporter domain protein
Protein accession	YP_003151814
Protein GI	257065558
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000907116
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTGA TCTTGAACCT TCTGGGTATA GTTATTGTAA TAGGATTTAT GTTTTTAATA 
TCTATGAACA GGAAGGCTGT AAAAGTTAAG GGGATTTTCA CAGCTCTTTT AGCTCAATTT 
ATAATAGCAG GCCTTCTTGT GAAACTCCCT CAAGGAAGAG CGGCTATAGG AGCTGTTAGT 
AAGGCTGTAG AAAAGGTTTT ATCCTATGGT AGCGAGGGAA TCCAATTTGT TTTTGGATCT 
TTGGGAGATC CAGCAGCTGC ATCAGGATAT ATATTTGCCT TTCAAACCTT GACCAATATT 
ATATTTATAT CATCTTTAGT TGCAGTCTTG TTCTATACTG GAATTTTGGG TTTTGTAGTA 
TCAAAGATAG GTTGGCTCAT AGGAAAATTA TTTAAAACAT CAGAGGTTGA GTCCTTTGTA 
GCAGTTGCTA ATATGTTCTT AGGTCAAACT GACTCACCAA TCCTTGTAGC AAAATATTTA 
AACTTCATGA CAGAAAGTGA AGTAATGCTA GTCCTCGTTT CAGGAATGGG ATCAATGTCA 
GTATCAATTA TTGCAGGCTA TGTTGCCTTG GGAATCCCTA TGGAATCCTT GCTTATAGCA 
TCTACCATGG TTCCAGTTGG CTCAATCCTT CTATCCAAAA TTGTATGCCC ACAAACAGAG 
GAAATCCAAG AGCTCGGTGA AGTGAAGATG GACAGGAAGG GCAACAACGA AAACGTCCTA 
GATGCCTTGG CAAGTGGAGC CCTCGATGGA ATGAATATGG CTATGGCAAT AGGAGCAAGC 
CTTATAGCTA TAATTTCTAT AGTAGCTTTG ATAAATGGGA TTTTGGGCAT ATTTAATATT 
TCTTTGGAGA CTATCCTATC TTATGTATTT GCACCAATGG GTTACTTGAT GGGACTTGAA 
GGTAAGGAAG TCTTTACAGC AGGTGAGCTT TTAGGTTCAA AATTAATCTT AAACGAATTC 
GTAGCCTTTG GCAAGCTTGG TCCAATGCTT GCTACTATGA GCGAGAGAAC AGGTCTTATG 
CTTGCAGTAT CTCTTGCAGG ATTTGCTAAT GTAAGCTCAA TAGGAATTTG TATATCTGGT 
ATATCAGTCC TATGTCCAGA AAAAAGACCT GTTCTTGCAA AGCTTGCCCT AAGGGCTATG 
ATTGCGGGAT TCTGTGTCAG CGTACTATCA GCTTTAATAG TTGGTATTTG GTTATTATTC 
TAA

Protein sequence

MKLILNLLGI VIVIGFMFLI SMNRKAVKVK GIFTALLAQF IIAGLLVKLP QGRAAIGAVS 
KAVEKVLSYG SEGIQFVFGS LGDPAAASGY IFAFQTLTNI IFISSLVAVL FYTGILGFVV 
SKIGWLIGKL FKTSEVESFV AVANMFLGQT DSPILVAKYL NFMTESEVML VLVSGMGSMS 
VSIIAGYVAL GIPMESLLIA STMVPVGSIL LSKIVCPQTE EIQELGEVKM DRKGNNENVL 
DALASGALDG MNMAMAIGAS LIAIISIVAL INGILGIFNI SLETILSYVF APMGYLMGLE 
GKEVFTAGEL LGSKLILNEF VAFGKLGPML ATMSERTGLM LAVSLAGFAN VSSIGICISG 
ISVLCPEKRP VLAKLALRAM IAGFCVSVLS ALIVGIWLLF