Gene SeHA_C0071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0071
Symbol	carB
ID	6491670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	72325
End bp	75552
Gene Length	3228 bp
Protein Length	1075 aa
Translation table	11
GC content	59%
IMG OID	642740360
Product	carbamoyl phosphate synthase large subunit
Protein accession	YP_002044034
Protein GI	194447884
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0458] Carbamoylphosphate synthase large subunit (split gene in MJ)
TIGRFAM ID	[TIGR01369] carbamoyl-phosphate synthase, large subunit

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	80
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAAAC GTACAGATAT AAAAAGCATC CTGATTCTGG GCGCGGGCCC GATTGTTATC 
GGTCAGGCGT GTGAGTTTGA CTACTCCGGC GCTCAGGCAT GTAAAGCGCT GCGCGAAGAG 
GGTTACCGCG TTATTCTGGT GAACTCCAAC CCGGCCACCA TCATGACCGA CCCGGAAATG 
GCCGATGCCA CCTACATCGA GCCGATTCAC TGGGAAGTGG TGCGCAAAAT CATCGAAAAA 
GAGCGTCCGG ATGCGGTGCT GCCGACCATG GGCGGCCAGA CCGCGCTGAA CTGTGCGCTG 
GAGCTGGAGC GTCAGGGCGT GCTCGAAGAG TTCGGTGTGA CCATGATTGG CGCCACCGCC 
GACGCCATTG ATAAAGCCGA AGACCGTCGT CGCTTCGATA TCGCGATGAA GAAAATTGGT 
CTCGACACCG CGCGTTCCGG TATCGCGCAC ACTATGGAAG AAGCGCTGGC GGTTGCCGCT 
GACGTGGGCT TCCCGTGCAT CATCCGTCCG TCCTTTACCA TGGGCGGCAC CGGCGGCGGT 
ATCGCTTACA ACCGTGAAGA GTTCGAAGAA ATCTGCGAAC GCGGTCTGGA CCTCTCGCCA 
ACCAACGAGC TGCTGATTGA TGAATCGCTG ATCGGCTGGA AAGAGTACGA GATGGAAGTG 
GTGCGTGATA AAAACGACAA CTGCATCATC GTCTGCTCTA TCGAAAACTT CGATGCGATG 
GGTATCCACA CCGGTGACTC CATCACCGTG GCCCCGGCAC AGACGCTGAC CGACAAAGAA 
TACCAAATCA TGCGTAACGC CTCGATGGCG GTACTGCGTG AAATCGGCGT CGAAACCGGC 
GGTTCTAACG TCCAGTTCGC CGTGAACCCG AAAAACGGCC GTCTGATCGT TATCGAAATG 
AACCCGCGCG TCTCCCGCTC CTCGGCGCTG GCGTCGAAAG CCACCGGTTT CCCGATTGCT 
AAAGTGGCGG CCAAACTGGC GGTGGGTTAT ACCCTCGACG AGCTGATGAA CGACATCACC 
GGTGGCCGTA CGCCGGCGTC GTTTGAGCCG TCTATTGACT ACGTTGTCAC CAAAATTCCG 
CGCTTTAACT TTGAGAAATT CGCCGGTGCT AACGACCGTC TGACCACCCA GATGAAATCG 
GTCGGGGAAG TGATGGCGAT TGGCCGCACC CAGCAGGAAT CCCTGCAAAA AGCGCTGCGC 
GGCCTGGAAG TGGGCGCCAC CGGCTTCGAC CCGAAAGTCA GCCTCGACGA CCCGGAAGCG 
CTGACCAAAA TCCGCCGCGA GCTGAAAGAC GCGGGCGCGG ATCGTATCTG GTATATCGCC 
GATGCCTTCC GCGCAGGCCT CTCCGTCGAC GGCGTGTTCA ACCTGACCAA CATCGACCGC 
TGGTTCCTGG TGCAAATTGA AGAGCTGGTG CGTCTGGAAG AGAAAGTAAC TGAAGTCGGG 
ATTACTGGCC TCAACGCCGA CTTCCTGCGT CAGCTCAAGC GTAAAGGTTT TGCCGATGCG 
CGTCTGGCAA AATTGGCGGG CGTGCGCGAG GCGGAAATCC GCAAACTGCG CGACCAGTAT 
GACCTGCACC CGGTTTACAA ACGCGTGGAT ACCTGCGCGG CGGAATTCGC CACCGATACC 
GCCTACATGT ACTCCACTTA TGAAGATGAG TGCGAAGCGA ACCCGTCCGT TGACCGCGAT 
AAAATCATGG TCCTCGGCGG CGGCCCGAAC CGTATCGGCC AGGGTATCGA ATTTGACTAC 
TGCTGCGTAC ACGCCTCGCT GGCGCTGCGC GAAGACGGTT ACGAGACCAT CATGGTCAAC 
TGTAACCCGG AAACCGTCTC CACCGACTAC GACACTTCCG ACCGTCTGTA CTTCGAGCCG 
GTGACGCTGG AAGACGTGCT GGAAATCGTG CGCATCGAGA AGCCGAAAGG CGTTATCGTG 
CAGTACGGCG GCCAGACCCC GCTGAAGCTG GCGCGCGCGC TGGAAGCGGC AGGCGTGCCG 
GTTATCGGCA CCAGCCCGGA CGCCATCGAC CGCGCGGAAG ACCGTGAACG CTTCCAGCAT 
GCGGTTGACC GTCTGAAGCT GAAGCAACCG GCCAACGCCA CCGTCACCGC CATTGAACAG 
GCTGTCGAAA AAGCGAAAGA GATCGGCTAC CCGCTGGTGG TGCGTCCTTC TTACGTGCTG 
GGCGGCCGGG CGATGGAAAT TGTCTATGAC GAAGCCGATC TGCGTCGCTA CTTCCAGACA 
GCGGTCAGCG TCTCTAACGA TGCGCCGGTG CTGCTGGACC GCTTCCTTGA TGACGCGGTT 
GAAGTGGACG TGGACGCTAT CTGCGACGGC GAAATGGTGC TGATTGGCGG CATCATGGAA 
CACATAGAGC AGGCGGGCGT ACACTCCGGC GACTCCGCCT GTTCCCTGCC GGCCTACACG 
CTGAGCCAGG AGATTCAGGA TGTGATGCGC CAACAGGTGC AGAAGCTGGC CTTCGAGTTG 
CAGGTGCGCG GCCTGATGAA CGTGCAGTTT GCGGTGAAAG ACAACGAAGT CTATCTGATT 
GAAGTCAACC CGCGTGCGGC GCGTACCGTA CCGTTCGTCT CCAAAGCCAC CGGCGTTCCG 
CTGGCGAAAG TGGCGGCGCG CGTGATGGCC GGCAAATCGC TGACCGAGCA GGGCGTGACC 
CAAGAAATTA TCCCGCCGTA CTACTCGGTG AAAGAAGTGG TGCTGCCGTT CAACAAATTC 
CCGGGCGTTG ACCCGCTGTT AGGGCCAGAA ATGCGCTCCA CCGGGGAAGT GATGGGCGTG 
GGCCGTACCT TCGCGGAGGC GTTCGCTAAG GCGCAGCTGG GCAGTAACTC CACCATGAAG 
AAACAGGGCC GTGCGCTGCT CTCCGTTCGC GAAGGCGACA AAGAGCGCGT GGTGGACCTG 
GCCGCTAAGC TGCTGAAACA GGGCTTCGAG CTGGATGCTA CCCACGGTAC GGCGATTGTG 
CTGGGCGAAG CCGGTATCAA CCCGCGTCTG GTGAACAAGG TGCACGAAGG TCGTCCGCAC 
ATTCAGGACC GTATCAAGAA TGGCGAATAT ACCTACATCA TCAACACCAC CGCAGGTCGC 
CGCGCGATTG AAGACTCCAG GGTGATTCGC CGCAGCGCGC TGCAGTACAA GGTGCATTAT 
GACACCACGC TGAACGGCGG TTTTGCCACG ACGATGGCGC TCAATGCCGA TGCCACCGAG 
AAGGTAACCT CGGTGCAGGA AATGCACGCG CAGATCAAAA AGTCGTAA

Protein sequence

MPKRTDIKSI LILGAGPIVI GQACEFDYSG AQACKALREE GYRVILVNSN PATIMTDPEM 
ADATYIEPIH WEVVRKIIEK ERPDAVLPTM GGQTALNCAL ELERQGVLEE FGVTMIGATA 
DAIDKAEDRR RFDIAMKKIG LDTARSGIAH TMEEALAVAA DVGFPCIIRP SFTMGGTGGG 
IAYNREEFEE ICERGLDLSP TNELLIDESL IGWKEYEMEV VRDKNDNCII VCSIENFDAM 
GIHTGDSITV APAQTLTDKE YQIMRNASMA VLREIGVETG GSNVQFAVNP KNGRLIVIEM 
NPRVSRSSAL ASKATGFPIA KVAAKLAVGY TLDELMNDIT GGRTPASFEP SIDYVVTKIP 
RFNFEKFAGA NDRLTTQMKS VGEVMAIGRT QQESLQKALR GLEVGATGFD PKVSLDDPEA 
LTKIRRELKD AGADRIWYIA DAFRAGLSVD GVFNLTNIDR WFLVQIEELV RLEEKVTEVG 
ITGLNADFLR QLKRKGFADA RLAKLAGVRE AEIRKLRDQY DLHPVYKRVD TCAAEFATDT 
AYMYSTYEDE CEANPSVDRD KIMVLGGGPN RIGQGIEFDY CCVHASLALR EDGYETIMVN 
CNPETVSTDY DTSDRLYFEP VTLEDVLEIV RIEKPKGVIV QYGGQTPLKL ARALEAAGVP 
VIGTSPDAID RAEDRERFQH AVDRLKLKQP ANATVTAIEQ AVEKAKEIGY PLVVRPSYVL 
GGRAMEIVYD EADLRRYFQT AVSVSNDAPV LLDRFLDDAV EVDVDAICDG EMVLIGGIME 
HIEQAGVHSG DSACSLPAYT LSQEIQDVMR QQVQKLAFEL QVRGLMNVQF AVKDNEVYLI 
EVNPRAARTV PFVSKATGVP LAKVAARVMA GKSLTEQGVT QEIIPPYYSV KEVVLPFNKF 
PGVDPLLGPE MRSTGEVMGV GRTFAEAFAK AQLGSNSTMK KQGRALLSVR EGDKERVVDL 
AAKLLKQGFE LDATHGTAIV LGEAGINPRL VNKVHEGRPH IQDRIKNGEY TYIINTTAGR 
RAIEDSRVIR RSALQYKVHY DTTLNGGFAT TMALNADATE KVTSVQEMHA QIKKS