Gene Saro_2079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2079
Symbol
ID	3917727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2217156
End bp	2218502
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	65%
IMG OID	640444832
Product	biotin carboxylase / acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha
Protein accession	YP_497352
Protein GI	87200095
COG category	[I] Lipid transport and metabolism
COG ID	[COG0439] Biotin carboxylase
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.252313
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCATCA AGCGCCTGCT GATCGCCAAT CGCGGCGAGA TCGCGCTGCG CATCCATCGC 
GCGGCTCACG AAATGGGCAT CGAGACGGTC GCGGTGCACT CCACCGCCGA TGCCGATGCG 
ATGCACGTGC GCCTTGCCGA CCATGCGGTC TGCATCGGCC CGCCCGCCGC GAAGGACAGC 
TATCTCAACG TCGCCGCGAT CATCTCGGCT GCCGAGATCA CCCATGCCGA CGCGATCCAT 
CCGGGCTACG GCTTCCTTTC GGAAAACGCC AAGTTCGCGG AAATCGTCGA AGCGCACGGT 
ATCACCTGGG TCGGTCCCAA GCCAGAACAC ATCCGCACGA TGGGCGACAA GGTCGAGGCC 
AAGCGCACCG CGGGCGCGCT CGGCCTGCCG CTGGTCCCCG GTTCCGACGG CGCGGTGTCC 
GAAATCGACG AGGCCAAGAA GATCGCCGAT GCCATCGGCT ATCCGGTGAT CATCAAGGCA 
GCCTCGGGCG GCGGCGGTCG CGGCATGAAG GTTTGCAACA GCGCCGACCA GCTCGAAACG 
CTGATGCAGC AAGCCGGCAG CGAGGCGAAG GCCGCGTTCG GCGATGCCAC CGTCTATATC 
GAGAAGTATC TCGGCAACCC GCGCCACATC GAATTCCAGA TCTTCGGTGA CGGCAACGGC 
AACGCGATCC ACCTGGGCGA GCGCGACTGC TCGCTCCAGC GCCGCCACCA GAAGGTGCTC 
GAGGAAGCGC CCTCGCCCGT CATCTCGGCC GACGAACGTG CGCGCATGGG CGGCATCGTC 
GCCAAGGCCA TGGCCGACAT GGGGTATCGC GGCGCGGGCA CGATCGAGTT CCTGTGGGAG 
AACGGCGAGT TCTACTTCAT CGAGATGAAC ACCCGCCTTC AGGTGGAACA TCCGGTGACC 
GAGGCGATCA CCGGCGTCGA CCTGGTGCGC GAACAGATCC GCATTGCCGA TGGCAAGCCG 
CTTTCGGTCA CGCAGGACGA GATCGAGTTC AAGGGACACG CGATCGAGTG CCGCATCAAT 
GCGGAAGACC CGTTCACATT TGCCCCCTCG CCGGGACTGG TGAAGAGCTA TCACGCAGCG 
GGCGGCATGC ACGTGCGCGT CGATTCAGGT CTCTACGCCG GGTACAAGAT CCCGCCGTAC 
TATGACTCGA TGATTGCCAA GCTGATCGTC TACGGCCGGA CCCGCGAAGG CTGCATCATG 
CGGCTGAAGC GCGCGCTCGA GGAAATGGTG ATCGAAGGCC CCAAGACCTC GATCCCGCTC 
CACCAGCGCC TGCTGAGCCA GCCCGACTTC CTCAGCGGCG ACTACACGAT CAAGTGGCTC 
GAGGAATGGC TGGCCAAGGA CGCCTGA

Protein sequence

MAIKRLLIAN RGEIALRIHR AAHEMGIETV AVHSTADADA MHVRLADHAV CIGPPAAKDS 
YLNVAAIISA AEITHADAIH PGYGFLSENA KFAEIVEAHG ITWVGPKPEH IRTMGDKVEA 
KRTAGALGLP LVPGSDGAVS EIDEAKKIAD AIGYPVIIKA ASGGGGRGMK VCNSADQLET 
LMQQAGSEAK AAFGDATVYI EKYLGNPRHI EFQIFGDGNG NAIHLGERDC SLQRRHQKVL 
EEAPSPVISA DERARMGGIV AKAMADMGYR GAGTIEFLWE NGEFYFIEMN TRLQVEHPVT 
EAITGVDLVR EQIRIADGKP LSVTQDEIEF KGHAIECRIN AEDPFTFAPS PGLVKSYHAA 
GGMHVRVDSG LYAGYKIPPY YDSMIAKLIV YGRTREGCIM RLKRALEEMV IEGPKTSIPL 
HQRLLSQPDF LSGDYTIKWL EEWLAKDA