Gene Apre_1601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1601
Symbol
ID	8398413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1741757
End bp	1742827
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	41%
IMG OID	644995965
Product	mannonate dehydratase
Protein accession	YP_003153343
Protein GI	257067087
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1312] D-mannonate dehydratase
TIGRFAM ID	[TIGR00695] mannonate dehydratase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.475603
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATGA CATTTAGACA CTACGGAAAT GACGATCCAA TCTCACTAGA ATATATCGCA 
CAAATTCCTG GAGTTACAGG AGTTATGGTT ATGATGAACG AATGGGAAGC AGGAGAAGTT 
TGGGAGAAGG ATGTTTTCCA AGAATACGTT GATAAGTGCC ACGCAGTAGG CCTTGATTGT 
GAAATCATCG AATCAATCAA CGTCCACGAA GATATTAAGA TGGGTCTTCC AACAAGAGAT 
AAATATATCG AAAACTACAA AGAGTCCCTA AGAAACGTTG CGGCTTGCGG TGTAAAGACA 
GTAATCTACA ACTTCATGCC AGTATTTGAC TGGGTTAAGA CAGAATTATA CAAGGAGCTT 
CCTGATGGAT CTAATACCCT TGCCTTTGAC CAAGCCAAGG TAGAAGGCCT TTCTCCAAGA 
GATATGGTAA ATGAAATCCT CGACGGAGCA GGAAACTTCG AACTACCAGG CTGGGAGCCT 
GAAAGACTCT CTCAACTAGA GGATGTTCTT GAAAAATACA AGGATATTGA CGAAGACAAA 
TTAAGAGAAA ACTACAAATA CTTCCTTGAA GCAATAATCC CAACATGTGA AGAAGTAGGA 
ATCAAGATGG CAGTTCACCC AGACGATCCA GCTTGGCCAA TCTTCGATAT CCCAAGAATC 
ACATCAACTC CAGAAGATCT AGAAAAAATT GTAAACCTAG TAGACTCTCC ATCAAATACC 
CTATGTATTT GTACAGGATC ATTGGGATCT AGAGTTGAAA ATGACGTAGC TAAAATAATC 
GGAGACTTCG CTAAAAGAGG CAAAATAGGA GCGATTCACG CTAGAAACAT CAAGTTTACC 
GGCGAGAAAC AATTCTACGA ATCAGCTCAC CTTTCTAAGT GCGGTTCATT AGATATGTAC 
GCTATAATGA AAGCTCTATA CGATGCTGAT TTCGACGGCT ACCTAAGACC AGACCACGGA 
AGAATGATCT GGGGCGAAGA AGGAAGAGCA GGCTATGGAC TCTACGACAG AGCCCTAGGA 
GTTGCCTACC TCAACGGTCT ATGGGAAGCT ATAGATAAAA ATAACAAATA G

Protein sequence

MKMTFRHYGN DDPISLEYIA QIPGVTGVMV MMNEWEAGEV WEKDVFQEYV DKCHAVGLDC 
EIIESINVHE DIKMGLPTRD KYIENYKESL RNVAACGVKT VIYNFMPVFD WVKTELYKEL 
PDGSNTLAFD QAKVEGLSPR DMVNEILDGA GNFELPGWEP ERLSQLEDVL EKYKDIDEDK 
LRENYKYFLE AIIPTCEEVG IKMAVHPDDP AWPIFDIPRI TSTPEDLEKI VNLVDSPSNT 
LCICTGSLGS RVENDVAKII GDFAKRGKIG AIHARNIKFT GEKQFYESAH LSKCGSLDMY 
AIMKALYDAD FDGYLRPDHG RMIWGEEGRA GYGLYDRALG VAYLNGLWEA IDKNNK