Gene Mflv_3743 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_3743
Symbol	carB
ID	4975059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	-
Start bp	3992199
End bp	3995537
Gene Length	3339 bp
Protein Length	1112 aa
Translation table	11
GC content	68%
IMG OID	640457967
Product	carbamoyl phosphate synthase large subunit
Protein accession	YP_001135003
Protein GI	145224325
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0458] Carbamoylphosphate synthase large subunit (split gene in MJ)
TIGRFAM ID	[TIGR01369] carbamoyl-phosphate synthase, large subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0558638
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGTC GCTCAGACCT CAACCATGTG CTGGTGATCG GATCCGGACC GATCCTGATC 
GGGCAGGCCG CCGAGTTCGA CTACTCCGGC ACCCAGGCCT GCCGGGTGCT GCGGGCCGAG 
GGCCTGCAGG TCACCCTGAT CAACTCCAAT CCGGCCACGA TCATGACCGA CCCGGAATAC 
GCCGACCACA CCTACGTCGA GCCGATCACC GCGGACTTCG TCGAGAAGGT CATCGCCCAG 
CAGGCCGAGC GCGGCAACAA GATCGACGCG CTGCTGCCGA CCCTGGGCGG GCAGACCGCG 
CTCAACACCG CGGTGAAGCT GTACGAGAAC GGTGCGCTGG AGCGCTACGA CGTCGAGCTG 
ATCGGCGCCA ACTTCGACGC GATCCAGCGC GGCGAGGATC GGCAGAAGTT CAAGGACATC 
GTCACCAAGG TGGGCGGCGA GTCCGCGAAG TCCAGGGTGT GTTTCACCAT GGACGAGGTG 
CGCGACACGG TCGCCGAACT CGGGCTGCCC GTGGTGGTCC GGCCGAGCTT CACCATGGGC 
GGACTGGGCT CCGGGATGGC GTACTCGGCC GACGATGTGG AGCGCATGGC GGGGGAGGGC 
CTCGCGGCGT CCCCGTCGGC GAACGTGCTG ATCGAGGAAT CCATCTACGG ATGGAAGGAG 
TACGAGCTCG AGCTGATGCG CGACGGCCGC GACAACGTGG TGGTGGTCTG CTCGATCGAG 
AACTTCGATC CGATGGGCGT GCACACCGGC GACTCGGTCA CCGTCGCGCC GGCGATGACA 
CTCACCGACC GCGAGTACCA GAAGATGCGC ACCCTGGGCA TCGAGATCCT GCGTGAGGTC 
GGCGTCGACA CCGGCGGCTG CAACATCCAG TTCGCCGTCA ACCCGAAGGA CGGCCGGCTC 
ATCGTCATCG AGATGAACCC CCGGGTGTCG CGGTCCTCGG CGCTGGCGTC GAAGGCCACC 
GGGTTCCCGA TCGCCAAGAT CGCGGCCAAG CTCGCGATCG GTTACACGCT CGACGAGATC 
GTCAACGACA TCACCAAGGA AACCCCGGCG TGCTTCGAGC CGACGCTGGA CTACGTCGTG 
GTCAAGGCGC CGCGGTTCGC GTTCGAGAAG TTCCCCGGCG CCGACGCGAC GCTGACCACC 
ACCATGAAGT CGGTCGGCGA GGCGATGTCG TTGGGCCGCA ACTTCATCGA GGCGCTCGGC 
AAGGTGATGC GCTCGCTGGA GACCGGCCGG GCGGGCTTCT GGACGGGGGA GGACCCCGTC 
GGTGAGCTCG GCGAGGTGCT CGCGCGGCTG CGCACACCCA CCGACGGCCG GCTCTACGAC 
ATCGAATACG CGCTGCGTAT CGGCGCGACC GTGGAAGAGG TCGCCGAGGC CTCCGGCGTC 
GACCCGTGGT TCGTCGACCA GATCGGCGGC CTGGTCGAAC TGCGTGCCGA GCTGACCGAC 
GCCCCCGTGC TCGGCGAGGA ACTGCTCCGC CGCAGCAAGC ACCACGGGCT CTCCGACCGC 
CAGATCGCCG CGCTGCGACC CGAACTCGCC GGCGAGATGG GCGTACGGGC GCTGCGTCAG 
CGGCTGGGGA TCCACCCGGT GTTCAAGACC GTCGACACCT GCGCGGCCGA GTTCGAGGCC 
AAGACTCCGT ACCACTACAG CAGCTACGAG ATGGATCCCG CCGCGGAGAC CGAGGTCGCC 
CCGCAGACCG AGCGGGGCAA GGTGCTGATC CTCGGGTCGG GCCCCAACCG GATCGGGCAG 
GGCATCGAAT TCGACTACAG CTGTGTGCAC GCCGCGACCA CGCTCAGCGA GGCCGGCTTC 
GAGACCGTGA TGATCAACTG CAACCCCGAG ACGGTGTCGA CCGACTACGA CACCGCCGAC 
CGGCTGTACT TCGAACCGCT GACGTTCGAG GACGTGCTGG AGATCTACTA CGCCGAGCAG 
AGATCGGGCG AGGGCGGCCC GGGCGTGATC GGGGTGATCG TGCAACTCGG CGGTCAGACG 
CCGCTCGGAC TGGCCGAACG GCTGGAGAAA GCCGGGGTGC CGATCGTCGG CACCAAACCC 
GAGGCGATCG ACCTGGCCGA GGACCGCGGC GAGTTCGGCG AGGTGCTGCG CCGCGCCGGA 
CTGCCCGCGC CCCGGTTCGG GATGGCGACC AGCTTCGACC AGGCCCGCCG CATCGCCGCC 
GAGATCGGCT ACCCGGTGCT GGTGCGGCCG TCTTATGTGC TGGGCGGGCG CGGCATGGAG 
ATCGTCTACG ACGAGGACAC CCTCGAGGGC TACATCACCC GGGCAACCCA ACTCTCGCCC 
GAGCACCCGG TGCTCGTGGA CCGCTTCCTC GAAGACGCGA TCGAGATCGA CGTCGACGCG 
CTGTGCGACG GCACCGAGGT CTACATCGGC GGCGTGATGG AGCACATCGA GGAGGCCGGC 
ATCCACTCCG GTGACTCGGC GTGCGCGCTG CCCCCTGTGA CGCTGGGCCG CAGCGACATC 
GAGGCGGTGC GGCGCGCGAC CGAGGCGATC GCGTTCGGGG TCGGCGTGGT CGGCCTGCTC 
AATGTGCAGT ACGCGCTGAA GGACGACGTC CTCTATGTCC TGGAGGCCAA TCCGCGCGCA 
TCGCGCACCG TCCCCTTCGT CTCCAAGGCG ACCGCGGTAC CGCTGGCCAA GGCGTGCGCG 
CGGATCATGC TGGGCGCCAG CATCGCCGAG CTCCGCGAGG AGGGCGTGCT GGCCAGGACC 
GGTGACGGTG CGGCGACCGC GCGCAACGCG CCCGTGGCCG TGAAGGAAGC CGTCCTTCCC 
TTCCACCGGT TCCGCAAGGC GGACGGCGCG CAGATCGACT CGCTGCTCGG GCCGGAGATG 
AAGTCCACCG GCGAGGTGAT GGGCATCGCC CACGATTTCG GCAGCGCGTT CGCCAAGAGC 
CAGACCGCCG CCTACGGCTC GCTGCCCGCC AGCGGGACCG TGTTCGTCTC GGTCGCCAAC 
CGCGACAAGC GGTCCCTGGT GTTTCCGGTC AAGCGGCTCG CCGACCTCGG GTTCAAGATC 
CTGGCCACCG AAGGCACCGC GGAGATGCTG CGGCGCAACG GAATCCCGTG TGAAGAAGTG 
CGCAAGCACT TTGAAGAACC CAGTGCGGAC CGCCCACTGC GCTCTGCGGT CGAGGCGATC 
AAGGCCGGCG ACGTCGACAT GGTGCTCAAC ACCCCGTACG GCAATTCGGG GCCGCGCATC 
GACGGCTATG AGATCCGGTC GGCCGCGGTG TCGATGAACA TTCCGTGCGT GACCACCGTG 
CAGGGCGCGT CGGCTGCGGT GCAGGGCATC GAGGCGGGGA TCCGCGGTGA CATCGGCGTG 
ATGTCGCTGC AGGAACTGCA TTCCACGCTG GTCTCGTGA

Protein sequence

MPRRSDLNHV LVIGSGPILI GQAAEFDYSG TQACRVLRAE GLQVTLINSN PATIMTDPEY 
ADHTYVEPIT ADFVEKVIAQ QAERGNKIDA LLPTLGGQTA LNTAVKLYEN GALERYDVEL 
IGANFDAIQR GEDRQKFKDI VTKVGGESAK SRVCFTMDEV RDTVAELGLP VVVRPSFTMG 
GLGSGMAYSA DDVERMAGEG LAASPSANVL IEESIYGWKE YELELMRDGR DNVVVVCSIE 
NFDPMGVHTG DSVTVAPAMT LTDREYQKMR TLGIEILREV GVDTGGCNIQ FAVNPKDGRL 
IVIEMNPRVS RSSALASKAT GFPIAKIAAK LAIGYTLDEI VNDITKETPA CFEPTLDYVV 
VKAPRFAFEK FPGADATLTT TMKSVGEAMS LGRNFIEALG KVMRSLETGR AGFWTGEDPV 
GELGEVLARL RTPTDGRLYD IEYALRIGAT VEEVAEASGV DPWFVDQIGG LVELRAELTD 
APVLGEELLR RSKHHGLSDR QIAALRPELA GEMGVRALRQ RLGIHPVFKT VDTCAAEFEA 
KTPYHYSSYE MDPAAETEVA PQTERGKVLI LGSGPNRIGQ GIEFDYSCVH AATTLSEAGF 
ETVMINCNPE TVSTDYDTAD RLYFEPLTFE DVLEIYYAEQ RSGEGGPGVI GVIVQLGGQT 
PLGLAERLEK AGVPIVGTKP EAIDLAEDRG EFGEVLRRAG LPAPRFGMAT SFDQARRIAA 
EIGYPVLVRP SYVLGGRGME IVYDEDTLEG YITRATQLSP EHPVLVDRFL EDAIEIDVDA 
LCDGTEVYIG GVMEHIEEAG IHSGDSACAL PPVTLGRSDI EAVRRATEAI AFGVGVVGLL 
NVQYALKDDV LYVLEANPRA SRTVPFVSKA TAVPLAKACA RIMLGASIAE LREEGVLART 
GDGAATARNA PVAVKEAVLP FHRFRKADGA QIDSLLGPEM KSTGEVMGIA HDFGSAFAKS 
QTAAYGSLPA SGTVFVSVAN RDKRSLVFPV KRLADLGFKI LATEGTAEML RRNGIPCEEV 
RKHFEEPSAD RPLRSAVEAI KAGDVDMVLN TPYGNSGPRI DGYEIRSAAV SMNIPCVTTV 
QGASAAVQGI EAGIRGDIGV MSLQELHSTL VS