Gene Apre_1278 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1278
Symbol
ID	8398067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1375597
End bp	1376766
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	42%
IMG OID	644995622
Product	ApbE family lipoprotein
Protein accession	YP_003153022
Protein GI	257066766
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATAA AGAAAGTATT TTACCCCTTG GCAATGGCCC TTGTAATAAC AGCCTGTGCC 
AATGGAGCAA ATGAGACAGA TAATAATAAG GACCAGGTAA GCCAAGCGGA AGAAAAAGTA 
GAGAAAAAAG AGGCAGAGGA AGACACAAAA GCAGAAGATG TAGGAGAAAA TCAAGAAGAT 
AAGAAAAGCA CTGAAGTGCC AAAACTTGAC AAAACCTACT ACGACTATTT CGACACTGTA 
ACTACCCTTC TAACCTACTC TGATGATGAA GAAAGCTTCA AGAAACAATG CGACGTCCTC 
GAAGAAGAGC TAGCTAGATA TCACAAGCTC TACAACTCCT ACGATTCCTT CGAAGGAGTA 
AATAACTTCA GAACAATCAA CGAAAAGGCA GGAATCGAGC CAGTCAAGGT AGACCCTGAA 
ATAATCGAGC TAATCGAATA CTCAAAGAAA ATGTACGAAC TAACAGACGG AAACATCAAC 
ATAGCCATGG GATCTCTCCT AGGCTTGTGG CACCAATACA GGGAAATGTC CATAGATAAT 
CCTGAAAAGG CAGCAATCCC ACCAGAAGAT GAGCTCATCA AGAAAAGCGA GCACGAAAAC 
ATAGATGCCA TTGAAATAGA CAAGGAAAAC TCCACAGTCT ACATCAACGA CCCAGACGTC 
CAAATAGATA TAGGAGCAAT CGGCAAAGGC TACGCCACAG AAAAAATGGC AGAAAAACTA 
AAAGAAGCAG GATTTGAAAG AGGAATCCTC TCAGTCGGTG GAGATGACGT AATCATAGGA 
GAAAATCCAA ACAACAGCCA AGGAAACTGG AAAATAGCAG TCCAAAATCC CTTCCTAGAA 
GATAAAGAAA ATCCATACTC CACAGTAGTA AACGTCAAGA ACACCTCAGT AGTAACAAGC 
GGTGACTACC AAAGATTCTT CACAGTAGAC GGCAAAAACT ACCACCACAT CATAGACCCA 
GCCACCAGAT ACCCATCCGA CAAATGGAAA TCCGTATCAG TAAAAGCAGA CAGCATAGCC 
CTAGCAGACA CCCTCTCAAC CTACTTCTTC ATAGTAGACC ACGAGACAGG ACTAAAAAAA 
GCAGCTGAAA ACAAAGTAGA AGCATACTGG ATAGACCAAG AAGGAAACGA ATACAAAACC 
GAAGGCTGGG AAAAAATAGA AGATAAATAA

Protein sequence

MRIKKVFYPL AMALVITACA NGANETDNNK DQVSQAEEKV EKKEAEEDTK AEDVGENQED 
KKSTEVPKLD KTYYDYFDTV TTLLTYSDDE ESFKKQCDVL EEELARYHKL YNSYDSFEGV 
NNFRTINEKA GIEPVKVDPE IIELIEYSKK MYELTDGNIN IAMGSLLGLW HQYREMSIDN 
PEKAAIPPED ELIKKSEHEN IDAIEIDKEN STVYINDPDV QIDIGAIGKG YATEKMAEKL 
KEAGFERGIL SVGGDDVIIG ENPNNSQGNW KIAVQNPFLE DKENPYSTVV NVKNTSVVTS 
GDYQRFFTVD GKNYHHIIDP ATRYPSDKWK SVSVKADSIA LADTLSTYFF IVDHETGLKK 
AAENKVEAYW IDQEGNEYKT EGWEKIEDK