Gene Nmul_A0433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0433
Symbol
ID	3785901
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	480398
End bp	481468
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	52%
IMG OID	637810509
Product	magnesium and cobalt transport protein CorA
Protein accession	YP_411133
Protein GI	82701567
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0598] Mg2+ and Co2+ transporters
TIGRFAM ID	[TIGR00383] magnesium Mg(2+) and cobalt Co(2+) transport protein (corA)

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATATCCC CTTCCAAAAA GAGATCCAAG AAAGCAGGCC TGCCGCCGGG CATGCCGGTG 
CATATCGGGG CAAAGAAAAA CGCGTCCCCA CGCATAACCT TGCTGGATTA CGATCCGGAA 
GGCGTGCGTG AAGCCGAGGT GGCTCCCGCA GACCTTGCCG AAAAGATCAA ACACGCTTCC 
GGGGTCAAGT GGGTTAACCT GCAGGGCCTG GGCGACATCC ACATGATCGA GCAGTTCGGC 
GCATGTTTTA ACCTTCACCC TCTGGTACTG GAAGACATAT TCAACACAGA GCAACGCTCC 
AAGGTGGAGG ATTACGGAGA TTACCTGTAC GTGGTGCTCA AAACCTTCGG GTATGAAACC 
AGGGGTAAGG AAGAGAGAAT ATATTCCGAA CAGATCAGTC TTGTACTCGG CAAGGATTTC 
GTGCTGTCGT TTCTGGAAGC GAATGGTGTT CAATTCGAGT CGGTCCGCGA CCGCCTGCGG 
GCCGGCAAAG GCCAAAGCGC AAGACTTGGT GCCGATTTCC TGATGTACAA CCTGATTGAT 
TCAGTGGTCG ACACCTACTT CAGCATTCTT GAACGCCTCG ACGAAAAAAC CGAAGCGCTG 
GAAACGGAAC TGGTCGATCG TCCGCAGCCG AGCACCTTGC AATCCATTCA AAGACTCAAA 
CGTGAAGGCG TTTTTTTACG CAGGGCGCTG TGGCCGCTCC GCGAGGTAAT CAGTTCTTTG 
CAACGTGGAG ATTCACCCCT GTTTAGCCGC AATACTCTGC TCTACCTGCG GGATGTGTAC 
GACCATACTG TCCACATTAT CGAATCGATC GAATCGCTGC GTGACGTCAC GGCGGGCATG 
CTCGATATTT ATTTATCGAG CGTAAGTTTC CGCATCAGTA CTGTCATGAA AGTTCTTACC 
GTCATCACCA CCATATTCAT GCCTTTGACG CTGATAACGG GCATTTACGG AATGAACTTC 
ACGTACATGC CGGGGCTTGA ATGGCACATG GGATTTTTTA TTGTACTGAC CGCAATGGCA 
GTCATCAGTA TTGCGATGCT GCTACTGTTC CGCTGGAAAA AATGGTTGTA G

Protein sequence

MISPSKKRSK KAGLPPGMPV HIGAKKNASP RITLLDYDPE GVREAEVAPA DLAEKIKHAS 
GVKWVNLQGL GDIHMIEQFG ACFNLHPLVL EDIFNTEQRS KVEDYGDYLY VVLKTFGYET 
RGKEERIYSE QISLVLGKDF VLSFLEANGV QFESVRDRLR AGKGQSARLG ADFLMYNLID 
SVVDTYFSIL ERLDEKTEAL ETELVDRPQP STLQSIQRLK REGVFLRRAL WPLREVISSL 
QRGDSPLFSR NTLLYLRDVY DHTVHIIESI ESLRDVTAGM LDIYLSSVSF RISTVMKVLT 
VITTIFMPLT LITGIYGMNF TYMPGLEWHM GFFIVLTAMA VISIAMLLLF RWKKWL