Gene Smed_2229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2229
Symbol
ID	5323090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2309639
End bp	2310844
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	64%
IMG OID	640791167
Product	carbamoyl phosphate synthase small subunit
Protein accession	YP_001327896
Protein GI	150397429
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCGA CACCCGCATG GACAATCCAG AAACCCACTG CCCTGCTCGT TCTGGCCGAC 
GGCACGGTGA TCGAAGGCAA GGGCATCGGC GCGACCGGAA AGGTTCAGGC CGAGGTCTGT 
TTCAACACGG CGCTGACCGG ATACCAGGAA ATCCTGACCG ATCCCTCCTA TCTCGGTCAG 
ATCGTCACCT TCACCTTCCC GCATATCGGC AATATCGGCG CCAATGACGA GGACATCGAG 
GATCTGACAC CCGCCGCGCG CCACGGTGCC GTCGGCGTGA TCTTCAAGGC CGACATCACG 
GAGCCCTCCA ACTACCGCGC CGCCAGGCAT CTCGATACTT GGCTGAAGGC GCGCGGCATC 
ATCGGCCTCT GCGGCATCGA CACGCGTGCG CTGACCGCCT GGATCCGCGA AAACGGCATG 
CCGAACGCCG TCATCGCACA CGATCCGGCG GGCGTCTTCG ATGTCGGGGC GTTAAAGGCC 
GAGGCGAAGG CGTGGAGCGG TCTCGAAGGC CTCGACCTCG CCAAGGTCGC CACTTCCGGC 
CAGTCCTATC GCTGGGATGA GAAGCCCTGG ATCTGGGACG AGGGCTATTC GACGCTCGGC 
GAAACCGATG CCGCCTATCA TGTCGTCGCC CTCGACTACG GCGTCAAGCG GAACATTCTC 
CGCCTCTTCG CCGGGCTAAA TTGCCGTGTC ACCGTCGTCC CGGCTCAGAC GAGCGCCGAG 
GAAGTTCTGG CGCTAAGGCC CGATGGCATC TTCCTGTCGA ACGGCCCGGG CGACCCGGCC 
GCAACCGGCG AATATGCCGT GCCGGTCATC AAGGATCTCC TCAAGACGGA TATCCCGGTC 
TTCGGCATAT GCCTGGGCCA CCAGATGCTG GCGCTGGCGC TGGGTGCCAG GACCGAGAAG 
ATGCACCAGG GCCACCACGG CGCCAACCAC CCGGTCAAGG ACCACACCAC CGGCAAGGTC 
GAGATCGTTT CGATGAATCA CGGCTTCGCA GTCGATGCGA ACTCGCTCCC GCAAGGGGTT 
GAACAGACTC ACATCTCGCT GTTCGACGGC ACCAATTGCG GCCTGCGCGT CGACGGCAGG 
CCGGTCTTCT CGGTCCAGCA CCACCCGGAA GCTTCGCCGG GCCCGCAGGA CAGCCATTAC 
CTCTTCCGCC GCTTCCTGAA CCTCATTCGT GAGAAGAAAG GCGAACCGGC ACTCGCCGAG 
CGCTGA

Protein sequence

MTATPAWTIQ KPTALLVLAD GTVIEGKGIG ATGKVQAEVC FNTALTGYQE ILTDPSYLGQ 
IVTFTFPHIG NIGANDEDIE DLTPAARHGA VGVIFKADIT EPSNYRAARH LDTWLKARGI 
IGLCGIDTRA LTAWIRENGM PNAVIAHDPA GVFDVGALKA EAKAWSGLEG LDLAKVATSG 
QSYRWDEKPW IWDEGYSTLG ETDAAYHVVA LDYGVKRNIL RLFAGLNCRV TVVPAQTSAE 
EVLALRPDGI FLSNGPGDPA ATGEYAVPVI KDLLKTDIPV FGICLGHQML ALALGARTEK 
MHQGHHGANH PVKDHTTGKV EIVSMNHGFA VDANSLPQGV EQTHISLFDG TNCGLRVDGR 
PVFSVQHHPE ASPGPQDSHY LFRRFLNLIR EKKGEPALAE R