Gene Nmul_A1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1040
Symbol
ID	3785167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1202564
End bp	1204138
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	54%
IMG OID	637811124
Product	arginine decarboxylase
Protein accession	YP_411735
Protein GI	82702169
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1982] Arginine/lysine/ornithine decarboxylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACCGGA TTTTGAATGC CCAGCTTCAG GAAAAAGCGC GCACGCCTTT TTACGATCAA 
CTCAAAAGTT ATGTATTGAT GGCAAAGGAT GCCTGGCATA CACCTGGGCA TTCTTCAGGC 
GATTCGTTGC GGGACAGTCC CTGGGCCAGC GATTTCTACC AGTTTATCGG CGAGCATATT 
TTTCGCGCAG ATCTGTCGGT GTCGGTGCCC ATGCTCGATT CGCTCATGGA ACCTTCCGGG 
GTCATTGCCG AAGCGCAGAA GATTGCGGCA AAGGCGTTTG GCGCGCGCCG CACTTTTTTT 
GCCACAAATG GCACTTCCAC CGCCAACAAG GTGATATTCC AGACGTTGCT CGCTCCTGGC 
GAAAAGCTGC TGCTGGATCG GAACTGCCAT AAATCGGTTC ATCACGGAGT CGTGCTATCC 
GGCGCCCATC CCATCTATCT CAACTCCTCG GTAAACAAGA AATTCGGGGT TTATGGGCCG 
GTGCCCAAGC AGACACTGTT CAGGGCAATC GAAGAACATC CCGATGCCCA GGCGCTCATA 
CTCACGAGTT GCACCTATGA TGGTTTCCGC TATGACCTGC CTCCGATCAT AGAGGCCGCG 
CATGCCAAAG GCATCAAGGT GATCATCGAT GAAGCCTGGT ACGGGTTCGC CCGCTTTCAT 
CCGGCTTTCC GTCCCACCGC CCTGGAAGCA GGCGCAGATT ATGCTACTCA AAGTACACAC 
AAGGTGCTGT CGGCTTTTTC CCAGTCCAGC ATGATTCATA TCAATGATCC CGAATTCAAC 
GAGCATCTGT TTCGGGAAAA TTTCAACATG CATACTTCCA CCAGCCCGCA GTACAGCATG 
ATTGCAAGTC TCGACGTGGC GCGCAAACAG GTGGTGATGG AGGGATACAA GCTATTGTCG 
CGCACGCTGG AGCTGGCGAA GGAAGTACGT GAGCAAATCA ATTCGACCGG CGTGTTTCGC 
GTACTGGAAC TGACGGATCT GCTGCCTGAC GAGGTGAAGA ACGACAATAT CCAGCTCGAT 
TCGACCAAGG TCACCGTCGA TATTTCGCAT TGTGGCTTTA CGGTGGAAGA TTTGGTCCGG 
GAACTGTTCG AGCGATATAA CATTCAGGTG GAAAAATCCA CTTTCAATAC GCTCACTCTG 
CTGCTGACCA TCGGTACCAC GCGCAGCAAG GTATCGCGCC TTTACGATGC TCTCATGCGC 
ATCGCACGCG AGGGCAGGGC GCCCCGCAGA CTCTACCAGA TCCCGGAGCT TCCGGGATTT 
ACTGAATTGA AGTATCTGCC GCGGGATGCC TTTTACTGCG GCGGCGAGAT CGTTCCGTTG 
CTCGACGAGC AGGAGCGGAT AAATGATAGC CTGAAAGGGA AGGTCTGCGC GGATCAGATC 
ACGCCTTACC CCCCGGGTAT TCCGGTCCTG GTGCCAGGCC AGACCATCAC GTCCGGGGTG 
GTGCAATATC TAGTCAGCAT GCTACGATCG CAGAAACGGG TGGAAGTGCA CGGGATCGTT 
TATGACGGCT ATCTGCCGTG TTTGAGGCTG TTGAGCGACG TCGAGGAAAA GAGCTTGAAA 
AAGCTTGCAA AATAG

Protein sequence

MYRILNAQLQ EKARTPFYDQ LKSYVLMAKD AWHTPGHSSG DSLRDSPWAS DFYQFIGEHI 
FRADLSVSVP MLDSLMEPSG VIAEAQKIAA KAFGARRTFF ATNGTSTANK VIFQTLLAPG 
EKLLLDRNCH KSVHHGVVLS GAHPIYLNSS VNKKFGVYGP VPKQTLFRAI EEHPDAQALI 
LTSCTYDGFR YDLPPIIEAA HAKGIKVIID EAWYGFARFH PAFRPTALEA GADYATQSTH 
KVLSAFSQSS MIHINDPEFN EHLFRENFNM HTSTSPQYSM IASLDVARKQ VVMEGYKLLS 
RTLELAKEVR EQINSTGVFR VLELTDLLPD EVKNDNIQLD STKVTVDISH CGFTVEDLVR 
ELFERYNIQV EKSTFNTLTL LLTIGTTRSK VSRLYDALMR IAREGRAPRR LYQIPELPGF 
TELKYLPRDA FYCGGEIVPL LDEQERINDS LKGKVCADQI TPYPPGIPVL VPGQTITSGV 
VQYLVSMLRS QKRVEVHGIV YDGYLPCLRL LSDVEEKSLK KLAK