Gene Moth_1524 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1524
Symbol
ID	3831989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1569058
End bp	1570404
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	59%
IMG OID	637829456
Product	acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha / biotin carboxylase
Protein accession	YP_430376
Protein GI	83590367
COG category	[I] Lipid transport and metabolism
COG ID	[COG4770] Acetyl/propionyl-CoA carboxylase, alpha subunit
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000000243805
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0117003
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAGAA GGGTTTTAGT TGCCAACCGC GGCGAGATTG CCGTACGGAT TATCCGGGCC 
TGCCGGGAAC TGGATATTGA AACGGTGGCC GTTTATTCAG AGGCTGACCG GGATTCCCTG 
CATACCCGCC TGGCCGATAA GGCCGTCTGT ATCGGGCCGG CCCCGGCTAA CCGCAGCTAC 
CTGCATATTC CCAGCATCAT TACCGCCGCC AGGATGAGCG GAGCCGACGC CATTCACCCC 
GGTTACGGTT TCCTGGCGGA GAATCCCTAC TTCGCCGAGA TGTGCGAAAC GTCGGGGATT 
ACCTTCATCG GCCCCTCGCC TCGTTCCATG CAGCTTATGG GGGATAAGGC CACGGCCCGG 
GCAACCATGA TCGCCGCCGG GGTGCCGGTA GTCCCCGGCT CCGAGGGTGT AATCAAAGAC 
CTGGACGCCG CCCTGGCGGT AGCCAAAGAG ATAGGATACC CGGTGTTGAT TAAAGCTGCG 
GCCGGCGGTG GCGGCCGGGG GATCCGCGTC GCCCAGGGGC CCAGGGAGCT ACGCCAGGCC 
GTTTTTACCG CCCAGCGGGA AGCCGAGGCC GCCTTTGGAA ACTCCCAGGT TTACCTGGAG 
AAATATATTG AAGAACCGCG CCATATAGAG TTTCAAATAA TCGGCGACAG GGAAGGAAAT 
ATCATCCACC TTGGGGAGCG CGACTGCTCC TTGCAGCGGC GCAACCAGAA AATCCTGGAG 
GAGGCTCCTT CAGGAGCCCT TACCCCCGAA CTGCGCCAGG AAATGGGCGC CCTGGCCCTG 
AAGGCCGCCA GGGCCGCCAA TTACTACAGC ACCGGCACGG TAGAGTTTTT ACTGGATAAA 
TACGGCCATT ACTATTTTAT AGAAATGAAT ACCCGCATCC AGGTGGAACA CCCGGTTACC 
GAGGCCGTCA CCGGCATCGA CCTGGTTCAG GAACAGATTA AAATTGCCGC CGGCGAGCCG 
CTGCGCCTGG CCCAGGAGGA TGTCCAGATC CGTGGCCATG CCCTGGAGTG CCGGATCAAT 
GCCGAGGACC CAGCCCATAA CTTCCGGCCG GCCCCGGGCC GTATTGAACG CTATCACGCG 
CCAGGGGGAT TCGGCATCCG GGTGGAGAGC GCTGTTTACA GCGGTTACAC CATCCCGCCC 
TTTTATGACT CCTTGATTGC CAAGGTTATT GCCTGGGCCC CGGACAGGGA AGCAGCCATC 
AACCGCATGA GCGGGGCTTT GAAAGAAATG GTGATTGAAG GGGTGCCTAC TACCATTCCC 
TTTCACCAGC AGATTATGGC CAATGCCTTT TTCCGGCGCG GGGAGATCTA CACCAACTTC 
ATCCAGCGCC GCTTAATGGC CGGTTAA

Protein sequence

MFRRVLVANR GEIAVRIIRA CRELDIETVA VYSEADRDSL HTRLADKAVC IGPAPANRSY 
LHIPSIITAA RMSGADAIHP GYGFLAENPY FAEMCETSGI TFIGPSPRSM QLMGDKATAR 
ATMIAAGVPV VPGSEGVIKD LDAALAVAKE IGYPVLIKAA AGGGGRGIRV AQGPRELRQA 
VFTAQREAEA AFGNSQVYLE KYIEEPRHIE FQIIGDREGN IIHLGERDCS LQRRNQKILE 
EAPSGALTPE LRQEMGALAL KAARAANYYS TGTVEFLLDK YGHYYFIEMN TRIQVEHPVT 
EAVTGIDLVQ EQIKIAAGEP LRLAQEDVQI RGHALECRIN AEDPAHNFRP APGRIERYHA 
PGGFGIRVES AVYSGYTIPP FYDSLIAKVI AWAPDREAAI NRMSGALKEM VIEGVPTTIP 
FHQQIMANAF FRRGEIYTNF IQRRLMAG