Gene Apre_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1100
Symbol
ID	8397887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1176008
End bp	1177360
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	39%
IMG OID	644995447
Product	citrate synthase
Protein accession	YP_003152848
Protein GI	257066592
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAGA AACAAGAAGA AAAACTAAAG TTCTATGCCA AAGAGATTGA AAGAAATAAT 
AAAATCAAAA AAGAAGTCTA TGAAAATTAT AATATAAAAA GAGGTCTTCG AAATAAAAAT 
GGGACTGGAG TCCTTGTCGG AGTAACCCAG GTGGGTGATG TATCAGGCTA TAAAATCATA 
GATGGAAAGA AAATCCCTAG CCGAGGTGAA CTCTACTATA GGGGCTACCC ACTTACAGAA 
ATTGTTGAAG ACATAGAAAG GGATAAAAGA TTAGGTTTTG AGGAGATTAT TTACCTATTA 
CTCTTTAGCA AACTAGCCAA TGAAGATGAG CTTAAATCCT TTAAGAGTAT CCTAGTCGAA 
GAAAGAGCTC TGGCGGATGG TTTTTTTGAG GACATAATCC TAAAAGTTCC AGGGTCTGAT 
ATAATGAATA AGATGATGAG GTCTATGCTC GCCCTTTATA CCTACGACAA AAATCCAGAT 
GGGACAGATG CCCTAAATGT TCTAAGTCAA TCCTTATCTT TAATTTCCAA GATACCAATC 
CTTGCAGTCT ACTCCTACCA GGTCAAAATC CACAATTTTG ATAAGAAGTC TCTGATAATC 
CACAATCCAG ATGATAGGCT GACAATCGCA GAAAACATCC TTCAAATGCT GAGAAATGAC 
CAAGCCTACG AGAAAGTTGA GGCTGAAATC CTAGACCTAA TGCTAATAAT TCACGCAGAA 
CACGGGGGAG GAAATAACTC TGCCTTTGCA ACCCATGTAG TCTCTTCATC GGGGACAGAT 
ACATATTCTG CTATAGCAGC AGGTCTTGCA TCCCTTAAGG GTCCCAAGCA TGGTGGAGCG 
AATCTCAAAG TAAGTAAGAT GCTTAAAGAT ATTAGAGAAA ACGTGGATGA TTTAGATGAT 
AGATCTAAGA TCAAAGCCTA TCTAGAAAAG ATTTTGGATA AAAAAGCCTT TGATAAGAAG 
GGTTTAATAT ACGGTCTAGG TCATGCCGTC TACACCTTAT CAGATCCTAG GGCAATTCTT 
CTTAAGAAAA AGGCCAGGGA ACTTTCTATA ATCAAGGGAA GGGAAGAGGA TTTTCACTTT 
ATAGAAAATG TAGAAAAAAT AGGAAAAGAC TTGATAAGTC AAAGGCAAAA CAGGCCATAT 
CCACCTTGCG CCAATGTAGA CCTTTACTCG GGCTTTGTCT ACGATATGCT AAAAATTCCT 
GAAGAGCTCT ACCTTCCTAT GTTTGCTATA GCAAGAACAG TTGGCTGGTC TGCCCATAGG 
TTAGAGCAAA TTCAAGATGA GAAGATAATC AGACCTGCTT ACAAGTCTCT AAATGACAGG 
AGGGACTATC TTCCCCTAAG AGAAAGAAAG TAA

Protein sequence

MDKKQEEKLK FYAKEIERNN KIKKEVYENY NIKRGLRNKN GTGVLVGVTQ VGDVSGYKII 
DGKKIPSRGE LYYRGYPLTE IVEDIERDKR LGFEEIIYLL LFSKLANEDE LKSFKSILVE 
ERALADGFFE DIILKVPGSD IMNKMMRSML ALYTYDKNPD GTDALNVLSQ SLSLISKIPI 
LAVYSYQVKI HNFDKKSLII HNPDDRLTIA ENILQMLRND QAYEKVEAEI LDLMLIIHAE 
HGGGNNSAFA THVVSSSGTD TYSAIAAGLA SLKGPKHGGA NLKVSKMLKD IRENVDDLDD 
RSKIKAYLEK ILDKKAFDKK GLIYGLGHAV YTLSDPRAIL LKKKARELSI IKGREEDFHF 
IENVEKIGKD LISQRQNRPY PPCANVDLYS GFVYDMLKIP EELYLPMFAI ARTVGWSAHR 
LEQIQDEKII RPAYKSLNDR RDYLPLRERK