Gene Nmul_A1436 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1436
Symbol
ID	3784629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1648834
End bp	1649958
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	57%
IMG OID	637811524
Product	hypothetical protein
Protein accession	YP_412131
Protein GI	82702565
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGTAGTT CGAAGCCACC AAGACCGGAT CCGCTCATCG GGCAGGCGGC AAAACAACAG 
GCCGATATCG CCCAGCAGCA ACTGGATGTG GCAAAGCAAC AGCTCGAATG GGAGAAGGAC 
AGAGCCAGGG TACAAGACCC CCTGATCCAG AAGATTGTAG ATCAGCAGAT TGCCTCAGGC 
GAAGCCAATG CGGCGAGGGC CGAATCGCAA TGGCAGGCAT ACCGCAACCT GTTTGCGCCG 
ATAGAAGAGC GCATGGTGAG GGAAGCCAAC GAGTTCGATT CGCTTGAGCG TAAAGAGCAG 
ATGGCGGCCG AGGCAGGAGC GGATATCGCA AAAAGTTATG AGAGCGCCCT GGATTCGAGC 
CAACGGACGA TGGGACGCAT GGGAGTAAAT CCTAATTCAG GCAAGTTTCA AGGCCTGACC 
CACGAGATCA GCCTTGGGCT TGCCAAAGAC ACGGCGGGAG CAATGAATAA GGCCCGACGC 
GAGACAGAAT TGCAGGGCAT GGCCATGCGG CAGGGCGTGG CCCAATTTGG GCGTAATATG 
CCCACCATGG GAATAGCTGC CGATGCGGCA GCGCTCAATG CAGGTAACGC CGCCACTGAC 
AACCTGGCAA CGAAAGCAGG GCTGCATACC GCCGGCATGA ATGCGGCGCA ACACTGGTAT 
GACGGCGCCC TTGGTGCGAA TAGCTCCTCC GGCAACCTGA TGCTGAACCA ATATCAGGGC 
CAACTGAATG CATGGCAGCA ACAGCAGCAG AATAAAGCGG GAGGACTCAG CGGGTTAGGC 
AATCTGGTCG GCACCCTGGG CGGAGCTTAC CTGATGAGAA CCCCAGGCCT GCGGACGGGC 
GGGGTCATCA GGAACTACAA TGCCTATGGT TTATCCACAT TGAAGCGCGA TGGCTATGGG 
AACAGTGGCA TAGTACGAGG TCCCGGTACC GGCACCAGCG ATTCCATCCC GGCTTCAATT 
GAAGGCGTGC AGCCTATCCG GTTATCCAAT GGCGAAGCGG TACTCAACAG AAAAGCGGTG 
GAACTTGTAG GGGAGGATTT CATTCACCGG CTCAATGTCG CCTCAGGGTT GATGAAGCGC 
AAGGCGACAG TGAATAAACA CAACAGGGAG GGGGACCATG CTTGA

Protein sequence

MCSSKPPRPD PLIGQAAKQQ ADIAQQQLDV AKQQLEWEKD RARVQDPLIQ KIVDQQIASG 
EANAARAESQ WQAYRNLFAP IEERMVREAN EFDSLERKEQ MAAEAGADIA KSYESALDSS 
QRTMGRMGVN PNSGKFQGLT HEISLGLAKD TAGAMNKARR ETELQGMAMR QGVAQFGRNM 
PTMGIAADAA ALNAGNAATD NLATKAGLHT AGMNAAQHWY DGALGANSSS GNLMLNQYQG 
QLNAWQQQQQ NKAGGLSGLG NLVGTLGGAY LMRTPGLRTG GVIRNYNAYG LSTLKRDGYG 
NSGIVRGPGT GTSDSIPASI EGVQPIRLSN GEAVLNRKAV ELVGEDFIHR LNVASGLMKR 
KATVNKHNRE GDHA