Gene Nmul_A0478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0478
Symbol
ID	3784895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	533840
End bp	534991
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	55%
IMG OID	637810554
Product	carbamoyl-phosphate synthase, small subunit
Protein accession	YP_411178
Protein GI	82701612
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCACAAC ATTCGTATGC CGTCCTCGCG CTTGCTGACG GCACAGTTTT TCGCGGCATG 
TCCATCGGCG CGGAAGGCAT CAGCACAGGG GAGGTGGTCT TCAACACCTC GATGACGGGA 
TATCAGGAAA TTCTCACGGA TCCCTCCTAC TGTCGCCAGA TCGTTACCCT CACTTATCCC 
CATATAGGCA ATACAGGCAC CAATCCGGAT GACGTGGAGT CCGGCAATAT CGACCGGGTA 
TATGCCGCCG GGTTGGTGAT AAGAGATCTG CCGTTGGCTT CCAGCAACTG GCGCGAAACG 
CAGACGTTGC CAGAGTATCT CAGGCAGCAG GGGGTGGTCG CCATCGCCGA CATCGATACC 
CGCAAGCTCA CACGCATTCT GCGGGAAAAG GGCGCTCAGG CAGGCTGCAT CATTGCGGGT 
CAGCCGGATG AAACGGAGGC GCTGAAGCTG GCCAGGGAAT TTCCGGGTCT TGCCGGAATG 
GACCTGGCCA AAGTGGTAAG CTGCCTGCAG CCTTATGAGT GGAACGAAGG GGAATGGCGG 
CTGGGGCAGG GTTACCCGGT TCAATCTCAT CCCCGTTTTC ATGTTGCAGC GATGGATTTC 
GGAATAAAAC GAAACATTCT GCGCAAGCTT GCACAGCGCG GCTGCCAAAT CACCGTATTC 
CCCGCGCAGA CAACCGCGGA CGAGATTCTG GCATCGCAAC CTGACGGAAT ATTCCTTTCG 
AATGGACCGG GTGATCCCGA GCCTTGCGAC TACGCTATCG AGACAACCAG AAGACTGCTG 
GAAAAGGAAA TACCGGTTTT CGGCGTGTGC ATGGGTCACC AGTTGCTAGG GCTGGCAACA 
GGCGCCAGAA CCATAAAAAT GAAATTTGGC CATCACGGCG CCAACCATCC GGTTCAGGAT 
CTGGGGACGG GAAAAGTGAT CATAACCAGT CAGAATCACG GGTTTGCGGT GGATACGGCC 
ACTTTGCCGG CAAATGCAAG AGTTACGCAT TTATCTTTAT TCGATGGCAG CTTGCAAGGA 
TTTGAGTTGG CGGGAAAGCC TGTATTCTGC TTTCAGGGGC ATCCCGAAGC GAGTCCGGGT 
CCGCATGACC TGGACTATCT GTTCGATAAA TTTGCGGGAT TGATGGAGAG AAAACGGACG 
AAAGCGATAT GA

Protein sequence

MPQHSYAVLA LADGTVFRGM SIGAEGISTG EVVFNTSMTG YQEILTDPSY CRQIVTLTYP 
HIGNTGTNPD DVESGNIDRV YAAGLVIRDL PLASSNWRET QTLPEYLRQQ GVVAIADIDT 
RKLTRILREK GAQAGCIIAG QPDETEALKL AREFPGLAGM DLAKVVSCLQ PYEWNEGEWR 
LGQGYPVQSH PRFHVAAMDF GIKRNILRKL AQRGCQITVF PAQTTADEIL ASQPDGIFLS 
NGPGDPEPCD YAIETTRRLL EKEIPVFGVC MGHQLLGLAT GARTIKMKFG HHGANHPVQD 
LGTGKVIITS QNHGFAVDTA TLPANARVTH LSLFDGSLQG FELAGKPVFC FQGHPEASPG 
PHDLDYLFDK FAGLMERKRT KAI