Gene RPB_2367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2367
Symbol
ID	3909366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2722148
End bp	2724163
Gene Length	2016 bp
Protein Length	671 aa
Translation table	11
GC content	66%
IMG OID	637884265
Product	carbamoyl-phosphate synthase L chain, ATP-binding
Protein accession	YP_485983
Protein GI	86749487
COG category	[I] Lipid transport and metabolism
COG ID	[COG4770] Acetyl/propionyl-CoA carboxylase, alpha subunit
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.60166
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCAAAC GTATTCTGAT CGCCAATCGC GGCGAGATCG CCTGCCGGGT CATCAAGACC 
GCCCGCCTGA TGGGAATCGA GACGGTCGCC GTCTATTCCG AGGCGGATCG CGACGCGTTG 
CACGTCGAGA TGGCCGATGA AGCGGTCCTG ATCGGACCGG CGGCGGCATC CGAGAGCTAT 
CTGGTGATCG AGAAGATCGT CGAGGCCTGC CGCAAGACCG GCGCCGAGGC GGTGCATCCG 
GGCTACGGCT TCCTGTCCGA GCGCGAATCC TTCCCGCGTA TCCTGGCCGA CGCCGGCATC 
GTCTTCATCG GTCCCAACGC CGGCGCGATC GCCGCGATGG GCGACAAGAT CGAATCCAAG 
AAGGCCGCCG CCAAGGCCAA CGTCTCGACC GTGCCGGGCT ATCTCGGCGT GATCGAGGAC 
GCCACCCACG CGGTGAAAAT CGCCGACGAG ATCGGCTATC CGGTGATGAT CAAGGCCTCG 
GCCGGCGGCG GCGGCAAGGG CATGCGGATC GCGCATTCGA CCAGTGAGGT CGCCGAAGGC 
TTCAACCTCG CCAAGGCGGA GGCGAAAGCC TCGTTCGGCG ACGATCGCGT CTTCATCGAG 
AAATTCATCG TCGACCCGCG CCACATCGAA ATCCAGGTGC TCGGCGACAA GCACGGCAAC 
GTCATCTATC TCGGCGAGCG CGAATGCTCG ATCCAGCGCC GCAACCAGAA GGTGATCGAG 
GAGGCGCCGT CGCCGCTGCT CGACGAGGTC ACCCGCCGGA AGATGGGCGA GCAGGCGGTC 
GCGCTGGCGA AAGCGGTGCA GTACGATTCC GCCGGCACCG TGGAGTTCGT GGCCGGTCAG 
GACAAGAGCT TCTACTTCCT CGAAATGAAC ACCCGCCTGC AGGTCGAACA CCCGGTCACC 
GAAATGATCA CCGGCATCGA CCTGGTCGAG CAGATGATCC GTGTCGCGGC CGGCGAGAAG 
CTCGAGCTTG CGCAGAAGGA CGTCAGGCTG AAGGGCTGGG CGGTGGAAAG CCGGGTCTAT 
GCGGAAGATC CGTTCCGCAA CTTCCTGCCG TCGATCGGCC GCCTGGTGAA GTATCGTCCG 
CCGAGCGAGA GCTCAGCCTC CGGCGTCACC GTGCGCAACG ACACCGGCGT GCAAGAAGGC 
GGCGAGATCT CGATCTTCTA CGATCCGATG ATCGCCAAGC TGGTGACGCA TGCGCCGTCG 
CGCGCGGCGG CGATCGAGGC GCAGGCGCAC GCGCTGGATG CGTTCTATGT CGATGGCATC 
CGCCACAACA TCCCGTTCCT GTCGGCGCTG ATGACGCATC CGCGCTGGCG CGAGGGCAAT 
CTCTCGACCG GCTTCATCGC CGAGGAATTC CCGCAGGGCT TCGCCGCGCG GCTGCCGGAG 
GGCGACGTCG CCCGCCGCAT CGCCGCGGTC GGCGCTGCGA TCGACCGCGT CGTCGGCGAG 
CGCAAGCGCA AGATTTCCGG CCAGATGATC GGCCGCGCGG TGATCCGCGA ACGCCGCCGC 
TGCGTCTGGC TCGAACGCAG CGAGATCGCG CTCGATGTGA TCCGCGAGGG CGAGGGCTTC 
GTGGTGCGCT TCGTCGAGGC CGACGGATCG CTGGGGCAGT CGCATCAATT GCTGTCGTCG 
TGGATTCCCG GCGACCCGGT GTGGCAGGGG ACCATCAACG GCAAGCCGGT CGCGGTGCAG 
GTCCGCTCGA TCCCGAACGG CGTCCGGCTC GCGCATCACG GCTACGAAGT CGCGGTCAAC 
GTCTTCACCG AGCGCGAAGC CTCGGCGGCG CGCTGGATGC TGGAGGGCAA CAAGGCCGAC 
ACCGGCAAGA AGGTGCTGTG CCCGATGCCG GGTCTGGTGG TCTCGATCGC GGTGGTCGAA 
GGCCAGGAGG TCAAGGCCGG CGAGACGCTG GCGGTGGTCG AGGCGATGAA GATGCAGAAC 
GTGCTGCGCG CCGAGCGCGA CGGCACGGTG AAGAAGATCC ACGCCGCGGC GGGCGCCACA 
CTCGCCGTCG ACGCGCTGAT CCTCGAGTTC GCGTAG

Protein sequence

MFKRILIANR GEIACRVIKT ARLMGIETVA VYSEADRDAL HVEMADEAVL IGPAAASESY 
LVIEKIVEAC RKTGAEAVHP GYGFLSERES FPRILADAGI VFIGPNAGAI AAMGDKIESK 
KAAAKANVST VPGYLGVIED ATHAVKIADE IGYPVMIKAS AGGGGKGMRI AHSTSEVAEG 
FNLAKAEAKA SFGDDRVFIE KFIVDPRHIE IQVLGDKHGN VIYLGERECS IQRRNQKVIE 
EAPSPLLDEV TRRKMGEQAV ALAKAVQYDS AGTVEFVAGQ DKSFYFLEMN TRLQVEHPVT 
EMITGIDLVE QMIRVAAGEK LELAQKDVRL KGWAVESRVY AEDPFRNFLP SIGRLVKYRP 
PSESSASGVT VRNDTGVQEG GEISIFYDPM IAKLVTHAPS RAAAIEAQAH ALDAFYVDGI 
RHNIPFLSAL MTHPRWREGN LSTGFIAEEF PQGFAARLPE GDVARRIAAV GAAIDRVVGE 
RKRKISGQMI GRAVIRERRR CVWLERSEIA LDVIREGEGF VVRFVEADGS LGQSHQLLSS 
WIPGDPVWQG TINGKPVAVQ VRSIPNGVRL AHHGYEVAVN VFTEREASAA RWMLEGNKAD 
TGKKVLCPMP GLVVSIAVVE GQEVKAGETL AVVEAMKMQN VLRAERDGTV KKIHAAAGAT 
LAVDALILEF A