Gene RPB_3020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3020
Symbol
ID	3910819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	3442308
End bp	3443663
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	66%
IMG OID	637884926
Product	acetyl-CoA carboxylase biotin carboxylase subunit
Protein accession	YP_486633
Protein GI	86750137
COG category	[I] Lipid transport and metabolism
COG ID	[COG0439] Biotin carboxylase
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.203212
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGATA AAATTCTCAT AGCCAATCGC GGCGAGATCG CTCTGCGGGT TCTGCGTGCG 
TGCAAGGAAC TGGGCATTGC CACGGTCGCC GTGCATTCGA CCGCCGACGC GGACGCGATG 
CATGTCCGGC TCGCGGACGA AAGCGTCTGT ATCGGCCCGC CGCCGTCCAA GGACAGCTAT 
CTCAACATCC CGGCGCTGCT GGCGGCCTGC GAGATCACCG GCGCCGACGC GGTGCATCCG 
GGCTATGGAT TTCTATCCGA GAATGCCCGT TTCGCCGAGA TTCTCGCCGA CCACAATCTG 
CATTTCATCG GCCCCAAGGC CGAGCACATC CGGCTGATGG GCGACAAGAT CGAGGCGAAG 
AAGACCGCCA GGCGCCTGGG CATCCCCGTG GTGCCGGGCT CGGACGGCGC GGTCGGCCCG 
GACGACGACG CGATGTCGAT CGCCAGGGAG ATCGGCTTTC CGGTGCTGGT CAAGGCCGCC 
GCCGGCGGCG GTGGCCGCGG CATGAAGGTC GCGCACACCG CCGAAGACCT GTCGATGGCG 
ATCTCGACCG CGGGCAACGA GGCCAAGGCC GCCTTCGGCG ACGCCTCGGT CTATCTGGAG 
AAGTATCTGC AGAAGCCGCG CCACATCGAA ATCCAGGTGC TGGGTGACGG CCGCGGCGGC 
GCGATCCATC TCGGCGAGCG TGACTGCTCG CTGCAGCGGC GGCACCAGAA GGTCTGGGAA 
GAGAGCCCCT CCCCGGTGAT CAGCGCGGAA GCCCGCGCCC GGATCGGCGG CATCTGCGCC 
AAGGCGATGC AGGACATGAG CTATGTCGGC GTCGGCACCA TCGAATTCCT CTACGAGGAC 
GGCGAATTCT ACTTCATCGA GATGAACACC CGGATCCAGG TCGAGCATCC GGTCACGGAG 
ATGATCACCG GGATCGATCT GGTGCTGGAG CAGATCCGGA TCGCCGCCGG CGGCGACCTG 
CCGGTGTCGC AGGACGAGAT CGTGCTCAAC GGCCACGCCA TCGAGTGCCG GATCAACGCC 
GAGAATCCGG TGAGCTTCCG GCCGTCGCCG GGCAAGATCG CGCGTTATCA TCCACCCGGC 
GGCCTCGGCG TCCGGATCGA TTCCGCAGTC TTCCAAGGCT ACACCATCCC GCCTTATTAC 
GACTCGCTTG TCGGCAAGCT GATCGTCCAC GGCAAGACCC GCGGCGAGTG CCTGATGCGG 
CTGCGGCGGG CGCTGGACGA GATGGTGGTC GACGGCATCG AGACCACACT GCCGCTGTTC 
CGCGCACTGG TGCGGGAACC GGGGATCATC GACGGCGATT ATCATATCCA CTGGCTGGAG 
CAGTATCTCG CCGGCGTCGC CCTCGAGGGC CGCTGA

Protein sequence

MFDKILIANR GEIALRVLRA CKELGIATVA VHSTADADAM HVRLADESVC IGPPPSKDSY 
LNIPALLAAC EITGADAVHP GYGFLSENAR FAEILADHNL HFIGPKAEHI RLMGDKIEAK 
KTARRLGIPV VPGSDGAVGP DDDAMSIARE IGFPVLVKAA AGGGGRGMKV AHTAEDLSMA 
ISTAGNEAKA AFGDASVYLE KYLQKPRHIE IQVLGDGRGG AIHLGERDCS LQRRHQKVWE 
ESPSPVISAE ARARIGGICA KAMQDMSYVG VGTIEFLYED GEFYFIEMNT RIQVEHPVTE 
MITGIDLVLE QIRIAAGGDL PVSQDEIVLN GHAIECRINA ENPVSFRPSP GKIARYHPPG 
GLGVRIDSAV FQGYTIPPYY DSLVGKLIVH GKTRGECLMR LRRALDEMVV DGIETTLPLF 
RALVREPGII DGDYHIHWLE QYLAGVALEG R