Gene EcSMS35_0032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0032
Symbol	carA
ID	6144305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	34771
End bp	35946
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	53%
IMG OID	641614933
Product	carbamoyl phosphate synthase small subunit
Protein accession	YP_001742149
Protein GI	170683312
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGAAT ATTCTCTGGA GGGTGTTTTG ATTAAGTCAG CGCTATTGGT TCTGGAAGAC 
GGAACCCAGT TTCACGGTCG GGCCATAGGG GCAACAGGTT CGGCGGTTGG GGAAGTCGTT 
TTCAATACTT CAATGACCGG TTATCAAGAA ATCCTCACTG ATCCTTCCTA TTCTCGTCAA 
ATCGTTACTC TTACTTATCC CCATATTGGC AATGTCGGCA CTAATGACGC CGATGAAGAA 
TCTTCTCAGG TACATGCACA AGGTCTGGTG ATTCGCGACC TGCCGCTGAT TGCCAGCAAC 
TTCCGTAATA CCGAAGACCT CTCTTCTTAC CTGAAGCGCC ATAACATCGT GGCGATTGCC 
GATATCGATA CCCGTAAGCT GACGCGTTTA CTGCGCGAGA AAGGCGCACA GAATGGCTGC 
ATTATCGCGG GCGATAACCC GGATGCGGCG CTGGCGTTAG AAAAAGCCCG CGCGTTCCCA 
GGTCTGAACG GCATGGATCT GGCAAAAGAA GTGACCACCG CAGAAACGTA TAGCTGGACA 
CAAGGGAGCT GGACGCTGAC CGGCGGCCTG CCAGAAGCGA AGAAAGAAGA CGAGCTGCCG 
TTCCATGTTG TGGCTTATGA TTTTGGTGCC AAGCGCAACA TCCTGCGCAT GTTGGTGGAC 
AGAGGCTGTC GTCTGACTAT CGTTCCGGCG CAAACTTCTG CGGAAGATGT GTTGAAAATG 
AATCCAGACG GCATCTTCCT CTCCAACGGC CCTGGCGACC CGGCCCCATG CGATTACGCC 
ATTACCGCCA TCCAGAAATT CCTCGAAACC GATATTCCGG TATTCGGCAT CTGCCTCGGT 
CATCAGCTGC TGGCGCTGGC GAGCGGTGCG AAGACTGTCA AAATGAAATT TGGTCACCAC 
GGCGGCAACC ATCCGGTTAA AGATGTTGAG AAAAACGTGG TGATGATCAC CGCCCAGAAC 
CACGGTTTTG CGGTGGATGA AGCAACATTA CCTGCAAACC TGCGTGTCAC GCATAAATCC 
CTGTTCGACG GTACGTTACA GGGCATTCAT CGCACCGATA AACCGGCGTT CAGCTTCCAG 
GGTCACCCGG AAGCCAGCCC TGGTCCACAC GACGCCGCGC CGTTGTTCGA CCACTTTATC 
GAGTTAATTG AGCAGTACCG TAAAACCGCT AAGTAA

Protein sequence

MSEYSLEGVL IKSALLVLED GTQFHGRAIG ATGSAVGEVV FNTSMTGYQE ILTDPSYSRQ 
IVTLTYPHIG NVGTNDADEE SSQVHAQGLV IRDLPLIASN FRNTEDLSSY LKRHNIVAIA 
DIDTRKLTRL LREKGAQNGC IIAGDNPDAA LALEKARAFP GLNGMDLAKE VTTAETYSWT 
QGSWTLTGGL PEAKKEDELP FHVVAYDFGA KRNILRMLVD RGCRLTIVPA QTSAEDVLKM 
NPDGIFLSNG PGDPAPCDYA ITAIQKFLET DIPVFGICLG HQLLALASGA KTVKMKFGHH 
GGNHPVKDVE KNVVMITAQN HGFAVDEATL PANLRVTHKS LFDGTLQGIH RTDKPAFSFQ 
GHPEASPGPH DAAPLFDHFI ELIEQYRKTA K