Gene GSU2019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2019
Symbol	accC
ID	2688045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	2212199
End bp	2213539
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	57%
IMG OID	637126710
Product	acetyl-CoA carboxylase, biotin carboxylase
Protein accession	NP_953068
Protein GI	39997117
COG category	[I] Lipid transport and metabolism
COG ID	[COG4770] Acetyl/propionyl-CoA carboxylase, alpha subunit
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.274625
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTCATA AAGTTCTGAT TGCAAATCGT GGCGAAATCG CCCTGAGGGT CATCCGGGCC 
TGCAAAGAGC TGGGAATCAA GACCGTTGCC GTCTACTCGA CAGCGGACAG GGATTCGCTC 
CATGTGAAGC TCGCGGATGA GAGTGTCTGC ATCGGTCCCG CGCCGAGCCT GCAGAGCTAT 
CTTAATATTA ACGCCATCAT TTCGGCTGCC GAATTGACCG ATGCCGAGGC AATCCACCCC 
GGCTACGGTT TTCTGTCGGA AAATGCCGCT TTTGCCGAAA TCTGTGAAAA CTGCGGTATA 
ACCTTCATCG GCCCCTCTTC ACAAAGCATG CGCATCATGG GCGACAAGAT CAGCGCCCGG 
CAGGCGGTGA TCAAGGAAAA TGTGCCGATC CTGCCCGGCA CCAAGGAGGG GGTTAACGAC 
GTCAACGAGG CGGTGAAGAT CGCCAAGAAG ATCGGCTTCC CCGTCATCAT CAAGGCGACT 
GCCGGAGGCG GTGGCCGGGG GATGAAGATC GTGCACTCCC CGGCGGCCCT CCCCAACGCC 
TTTGCCACGG CTCGCGCCGA GGCTCAGGCC GGTTTCGGCA ACCCTGAGGT CTACATTGAG 
AAGTATTGCG AGAAGCCGCG CCACGTTGAG ATCCAGGTCA TGGCCGACAA GCACGGTAAC 
GTGATTCACC TGGGTGAGCG GGACTGCTCC ATCCAGCGTC GCCACCAGAA GATCATCGAG 
GAGTCGCCGT GCCCGGTCAT GACTCCTGCA CTCCGCAAGG CCATGGGTGA TGCGGCTGTT 
CGCGCGTCCA AGGCAGTGGG GTACGACAGT GTCGGCACCG TTGAGTTCCT GGTGGACAAG 
GACCTCAACT TCTATTTCAT GGAAATGAAT ACCCGGGTGC AGGTTGAGCA TCCGGTGACC 
GAAATGGTGA CCGGCATCGA CATCGTCCGG GAGCAGATCC GTTCTGCAGC CGGTCTCAAG 
CTTCGTTACA AGCAAAGCGA CATTAAACTG CACGGTCACG CTATTGAATG CCGTATCAAT 
GCTGAAGATC CGGTGAAGTT CACCCCGTCG CCGGGCAAGA TCGTCGGTTA CCATACCCCG 
GGAGGTCTGG GTGTGCGGAT CGATTCTTTC GTCTATGATC AGTATTCCGT GGTCCCCCAC 
TACGACTCGC TCATAGCGAA GCTGATCGTC CACGCAGAGA CCAGGGAAGA CGCCATCCGC 
CGCATGGCCC GCGCCCTTGA CGAGTACATC ATTGAGGGCA TCAAGACCAC AATCCCCTTC 
CATAAGAGGA TCATGGACAA CAAAGACTTT ATGGAGGGGA ATGTCGACAC CGGCTTCCTC 
GAGCGAATCG TGCTGGAGTA G

Protein sequence

MFHKVLIANR GEIALRVIRA CKELGIKTVA VYSTADRDSL HVKLADESVC IGPAPSLQSY 
LNINAIISAA ELTDAEAIHP GYGFLSENAA FAEICENCGI TFIGPSSQSM RIMGDKISAR 
QAVIKENVPI LPGTKEGVND VNEAVKIAKK IGFPVIIKAT AGGGGRGMKI VHSPAALPNA 
FATARAEAQA GFGNPEVYIE KYCEKPRHVE IQVMADKHGN VIHLGERDCS IQRRHQKIIE 
ESPCPVMTPA LRKAMGDAAV RASKAVGYDS VGTVEFLVDK DLNFYFMEMN TRVQVEHPVT 
EMVTGIDIVR EQIRSAAGLK LRYKQSDIKL HGHAIECRIN AEDPVKFTPS PGKIVGYHTP 
GGLGVRIDSF VYDQYSVVPH YDSLIAKLIV HAETREDAIR RMARALDEYI IEGIKTTIPF 
HKRIMDNKDF MEGNVDTGFL ERIVLE