Gene Nmul_A1874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1874
Symbol
ID	3786524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2160005
End bp	2161147
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	55%
IMG OID	637811960
Product	hypothetical protein
Protein accession	YP_412561
Protein GI	82702995
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGACT ACCTGCTGAT CATTACTGCT GCCGCGATTT TGCTTGTCAC CATGGCCTAT 
CTGGTGATCC GGCTCGGTAT GCTTTCGACC ATGGTGCGCG AACTGCTGGG GCAGCAGGCA 
AGGCTGATGG AAGACAAGCA TCGCGACATG CTCAAGGATT TGCATGAAGG GCTGTCGAAC 
CAGGGCAACC GGCTTTCCGA GGTCCTGGGC AGGAATTCCG ATCAACTGCG GGGAACGGTG 
GAAGCGCGGC TGGACCAGAT CAGCGGGAGG GTGGCTGAAC GTCTCGACGA AGGGTTCAGG 
AAAACCAATG AGACTTTCAC CAGCGTCATG ACGCGGCTTG CGACGATCGA TGAAGCCCAG 
AAGAAGATCG ACAGCCTGAC CACCAATATG GTGAGCCTGC AGGAACTTCT GGGCGACAAA 
CGCTCGCGCG GCGCGTTTGG CGAAGTGCAA CTGGAAGCGC TGGTTCGCAA TATCCTGCCG 
CCCTCTGCAT ATGAAATGCA GCATACGCTT TCCAACAGCA GCCGCGCCGA TTGTGTGCTG 
AAGCTACCGC CTCCAACGGG CATGGTCGCG GTCGATTCAA AATTTCCGCT GGAAAATTTT 
CATCGCATGT TCGATCGTCA TACGGATGAC ACGAGCCGTG CCCTGGCGCA GAAGCAGTTC 
AAGGCGGACG TGAAAAAACA TGTGGACGAC ATTGCCGGTA AATATATCCT GCCGCCGGAA 
ACCTGCGATG GAGCGGTGAT GTTCGTACCG GCGGAGGCCG TTTTCGCCGA AATCCATGCC 
TATCATTCGG ACATAGTCGA TTACGCCATG CAGAAGCAGG TCTGGATAGT TTCGCCTACC 
ACCCTGATGG CGGTACTGAA TACCGCGCGT GCGGTGCTCA AGGATATCGA AACGCGCGAG 
CAGGTACACA TCATCAAGAA CGAACTGTCC AGGCTGGGCA AGGATTTTGC ACGCTTTGAC 
GAGCGCATGA AAAAACTTGC AGACCATATC CGCCAGGCCA ATCAGGATGT GGAAGAGGTA 
CATGTTTCAA GCCGGAAGAT AAGTCAACGC TTTGCCCGCA TAGAGGCCGT GGATCTCGAG 
CTGCCTCAAC TGGAAATGGA AACGCCAGTG ATGCAACCGG CGGACGAAGA AAACTCCAGA 
TAA

Protein sequence

MPDYLLIITA AAILLVTMAY LVIRLGMLST MVRELLGQQA RLMEDKHRDM LKDLHEGLSN 
QGNRLSEVLG RNSDQLRGTV EARLDQISGR VAERLDEGFR KTNETFTSVM TRLATIDEAQ 
KKIDSLTTNM VSLQELLGDK RSRGAFGEVQ LEALVRNILP PSAYEMQHTL SNSSRADCVL 
KLPPPTGMVA VDSKFPLENF HRMFDRHTDD TSRALAQKQF KADVKKHVDD IAGKYILPPE 
TCDGAVMFVP AEAVFAEIHA YHSDIVDYAM QKQVWIVSPT TLMAVLNTAR AVLKDIETRE 
QVHIIKNELS RLGKDFARFD ERMKKLADHI RQANQDVEEV HVSSRKISQR FARIEAVDLE 
LPQLEMETPV MQPADEENSR