Gene EcolC_3623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3623
Symbol
ID	6066559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3967424
End bp	3968572
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	53%
IMG OID	641603041
Product	carbamoyl phosphate synthase small subunit
Protein accession	YP_001726564
Protein GI	170021610
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.314254
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATTAAGT CAGCGCTATT GGTTCTGGAA GACGGAACCC AGTTTCACGG TCGGGCCATA 
GGGGCAACAG GTTCGGCGGT TGGGGAAGTC GTTTTCAATA CTTCAATGAC CGGTTATCAA 
GAAATCCTCA CTGATCCTTC CTATTCTCGT CAAATCGTTA CTCTTACTTA TCCCCATATT 
GGCAATGTCG GCACCAATGA CGCCGATGAA GAATCTTCTC AGGTACATGC ACAAGGTCTG 
GTGATTCGCG ACCTGCCGCT GATTGCCAGC AACTTCCGTA ATACCGAAGA CCTCTCTTCT 
TACCTGAAAC GCCATAACAT CGTGGCGATT GCCGATATCG ATACCCGTAA GCTGACGCGT 
TTACTGCGCG AGAAAGGCGC ACAGAATGGC TGCATTATCG CGGGCGATAA CCCGGATGCG 
GCGCTGGCGT TAGAAAAAGC CCGCGCGTTC CCAGGTCTGA ATGGCATGGA TCTGGCAAAA 
GAAGTGACCA CCGCAGAAGC CTATAGCTGG ACACAAGGGA GCTGGACGTT GACCGGTGGC 
CTGCCAGAAG CGAAAAAAGA AGACGAGCTG CCGTTCCACG TCGTGGCTTA TGATTTTGGT 
GCCAAGCGCA ACATCCTGCG GATGCTGGTG GATAGAGGCT GTCGCCTGAC CATCGTTCCG 
GCGCAAACTT CTGCGGAAGA TGTGCTGAAA ATGAATCCAG ACGGCATCTT CCTCTCCAAC 
GGTCCTGGCG ACCCGGCCCC GTGCGATTAC GCCATTACCG CCATCCAGAA ATTCCTCGAA 
ACCGATATTC CGGTATTCGG CATCTGTCTC GGTCATCAGC TGCTGGCGCT GGCGAGCGGT 
GCGAAGACTG TCAAAATGAA ATTTGGTCAC CACGGCGGCA ACCATCCGGT TAAAGATGTG 
GAGAAAAACG TGGTAATGAT CACCGCCCAG AACCACGGTT TTGCGGTGGA CGAAGCAATA 
TTACCTGCAA ACCTGCGTGT CACGCATAAA TCCCTGTTCG ACGGTACGTT ACAGGGCATT 
CATCGCACCG ATAAACCGGC ATTCAGCTTC CAGGGGCACC CTGAAGCCAG CCCTGGTCCA 
CACGACGCCG CGCCGTTGTT CGACCACTTT ATCGAGTTAA TTGAGCAGTA CCGTAAAACC 
GCTAAGTAA

Protein sequence

MIKSALLVLE DGTQFHGRAI GATGSAVGEV VFNTSMTGYQ EILTDPSYSR QIVTLTYPHI 
GNVGTNDADE ESSQVHAQGL VIRDLPLIAS NFRNTEDLSS YLKRHNIVAI ADIDTRKLTR 
LLREKGAQNG CIIAGDNPDA ALALEKARAF PGLNGMDLAK EVTTAEAYSW TQGSWTLTGG 
LPEAKKEDEL PFHVVAYDFG AKRNILRMLV DRGCRLTIVP AQTSAEDVLK MNPDGIFLSN 
GPGDPAPCDY AITAIQKFLE TDIPVFGICL GHQLLALASG AKTVKMKFGH HGGNHPVKDV 
EKNVVMITAQ NHGFAVDEAI LPANLRVTHK SLFDGTLQGI HRTDKPAFSF QGHPEASPGP 
HDAAPLFDHF IELIEQYRKT AK