Gene Apre_1139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1139
Symbol
ID	8397927
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1224443
End bp	1225759
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	37%
IMG OID	644995485
Product	hypothetical protein
Protein accession	YP_003152886
Protein GI	257066630
COG category	[S] Function unknown
COG ID	[COG1306] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000332623
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAATA AAAAGTTAAT CATTTCTTTT TTGATGACTC TTGTACTTAT TTTCACTGCT 
TGCTCAAAAG AGACTAGCAA AAGCACAGAG CCTAGTGAAA ATAAAAAGAG CGAAGAGAGT 
ATCGAAAATA GAGATGATTC TAAGGAAAAA GATGATAAGG CTAACAACAA GGGCTTGGTT 
AATGAAGCTG TCGATAAGGA AATTGGTGTA CCTTACGAGG TAGGTGTTAC TCCTGATGAC 
TACAATATGG ACTATGATAC TTCAAGACTT CACTCTCTTA AGGATAAGAA GAGCAAATAC 
TATCCTAAAG ATGGGGTTAA GGGTTTGTAT TTCAATACAT ATTCCATAAA CAATCCCGAA 
GTTTACGATA AAATAATGGA TATGTTGGAA AATACTAGAC TTAACTCAAT AGTAGTCGAT 
ATCAAAGATG ACTGGGGCAA TGTCACAATG GATTTCGATA CTGATGATCC TGATATTGAA 
TATGCAAGTA TTGATATTAT AAATCCAAAA GAATTTATCA AAGAGATGCA CGATAAGGGA 
ATTTATGTTA TTGGTAGGGT AACTACCTTC AAGGATTCTA TAATTACAGA AAAGCATCCT 
GATCGGGGCT TTACCCTTGA TGATGGTTCC TTGTGGAAGA ATGGTCATGG CGAGGCTTTT 
ATGAATCCTT TCCTTAAAGA AGTCCAAGAC TATGATATAA AGATTGCAAA ACTTGCCGCC 
GAAGCTGGCT TTGATGAGAT TCAGTTTGAC TATGTAAGAT TTGCTGAAGG CTTTGAGAAC 
TTTGGTGATA CTCTAGACTA TCCTAGGGGA GAATTTGAAG ATAAGAATAT GGAAGAAGGC 
GATAAGAGAG TCGCAGCAAT TACAGGTTTT GTTCAAAGAG CTAGAGAAGA ACTCCAAGAT 
AAAAAAGTTC CTATTTCTAT AGATGTATTT GGCTACGCTC TTCAGGTTGA AAGAGCAGGT 
GGTATCGGTC AAGATTTTGG TGAGATGAGC AACCAAACCG ATGTTATATC TTCTATGATT 
TATCCTTCTC ACTGGGGATT TAACTCTTTT GATATAGAAA AGCCTGACCT TGAACCATAT 
GAACTTGTCA AAAGATACTT GAAAGCGGAG CAAGAGTATC TATCAAAACT TGACCATCCA 
CCTCTATCAA GACCTTGGAT CCAAGACTTT ACTGCAAGCT GGATAGGTGA TGGCAACTGG 
ATGGAATATG ATAAGGATGC GGTTGAAGCT CAAATCAAGG CCATATACGA TTCTGGTCAA 
GAGGAGTTTC TGATTTGGAA TGCAAGCAGT GAATATACTC AAGGTGTGGA ATACTAA

Protein sequence

MKNKKLIISF LMTLVLIFTA CSKETSKSTE PSENKKSEES IENRDDSKEK DDKANNKGLV 
NEAVDKEIGV PYEVGVTPDD YNMDYDTSRL HSLKDKKSKY YPKDGVKGLY FNTYSINNPE 
VYDKIMDMLE NTRLNSIVVD IKDDWGNVTM DFDTDDPDIE YASIDIINPK EFIKEMHDKG 
IYVIGRVTTF KDSIITEKHP DRGFTLDDGS LWKNGHGEAF MNPFLKEVQD YDIKIAKLAA 
EAGFDEIQFD YVRFAEGFEN FGDTLDYPRG EFEDKNMEEG DKRVAAITGF VQRAREELQD 
KKVPISIDVF GYALQVERAG GIGQDFGEMS NQTDVISSMI YPSHWGFNSF DIEKPDLEPY 
ELVKRYLKAE QEYLSKLDHP PLSRPWIQDF TASWIGDGNW MEYDKDAVEA QIKAIYDSGQ 
EEFLIWNASS EYTQGVEY