Gene Nmul_A0354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0354
Symbol
ID	3784546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	383760
End bp	384803
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	58%
IMG OID	637810430
Product	dihydroorotase
Protein accession	YP_411054
Protein GI	82701488
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0418] Dihydroorotase
TIGRFAM ID	[TIGR00856] dihydroorotase, homodimeric type

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAATACCT TCACACTTAC ACGCCCGGAC GACTTCCACC TGCATCTCCG CGATGGCGAA 
CACATGCGGG CAGTGCTGGC GGACACTGCC CGCCGTTTTG CCCGCGCAAT CGTCATGCCC 
AACCTCAAGC CTCCCGTCAT CACCACGGAA ATGGCGGTGG CGTATCGCGG GCGGCTTCTT 
GCCGCCCTGC CGCAGGGCGT GCGCTTCGAG CCGCTGATGA CCCTCTACCT GACCGATAAC 
ACCTCCCCTT CGGAAATCAT CGAAGCAAAA AGAAGCGGAG TAATCTACGG CATCAAATAC 
TATCCCGCAG GCGCTACCAC AAACTCCGCG GCAGGAGTCA CCGACATTGC CAGATGCCAT 
GAAACTCTGG AAGCCATGGA GCAAGCGGAA ATGCCCATGC TGGTGCATGG CGAGGTAACC 
GATCCGGAGG TGGATGTATT CGACAGGGAA AAGGTCTTTC TTGAACGGAT GCTGATCCCG 
TTGACCCAGC GTTTTCCGCG ATTGCGCGTG GTATTCGAGC ATATCACCAC ACGGGAAGCG 
GTAGAGTTCG TCATCAACGC GCCGAAAACC GTCGCCGCCA CCATCACGGC CCACCACCTC 
CTGATCAGCC GGAATGCCCT TTTTCAAGGG GGTATTCGGC CTCACCACTA TTGCCTGCCC 
ATCCTCAAGC GGGAAACCCA CCGGCAGAAG CTGATCGAAG CGGCCACCAG CGGCAATCCG 
AAATTTTTCC TCGGCACCGA TAGCGCTCCC CACGCACAAT TCGCCAAGGA AAACGCCTGC 
GGCTGCGCCG GCATCTATAC TGCTCACGCA GCGATCGAGC TGTATGCGGA AGCATTCGAA 
CAGGCGGGCG CGCTGGAAAA ACTGGAAGCC TTTGCCAGTT TTCATGGTGC GGATTTCTAT 
CAGCTACCGC GCAATCAGGA CAAGATTACG TTGAAGAAGG AAAATTGGAG GGTGCCGGCG 
CAGCTGGAAT TTGGCGGCGA AAGCCTGATT CCATTCCGGG CGGGGGAAAA CGTTACCTGG 
GCCTTGGATA AAACCGGGAA TTAG

Protein sequence

MNTFTLTRPD DFHLHLRDGE HMRAVLADTA RRFARAIVMP NLKPPVITTE MAVAYRGRLL 
AALPQGVRFE PLMTLYLTDN TSPSEIIEAK RSGVIYGIKY YPAGATTNSA AGVTDIARCH 
ETLEAMEQAE MPMLVHGEVT DPEVDVFDRE KVFLERMLIP LTQRFPRLRV VFEHITTREA 
VEFVINAPKT VAATITAHHL LISRNALFQG GIRPHHYCLP ILKRETHRQK LIEAATSGNP 
KFFLGTDSAP HAQFAKENAC GCAGIYTAHA AIELYAEAFE QAGALEKLEA FASFHGADFY 
QLPRNQDKIT LKKENWRVPA QLEFGGESLI PFRAGENVTW ALDKTGN