Gene Nmul_A2200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2200
Symbol
ID	3786225
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2498321
End bp	2499817
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	55%
IMG OID	637812287
Product	ABC transporter related
Protein accession	YP_412884
Protein GI	82703318
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1134] ABC-type polysaccharide/polyol phosphate transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.206971
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCCC CGAGAGAACT CACAGCCGAA ACAAGATGCG GCTCCTCCAT GGACTCCTCT 
CCCCCAACGG CAACCGATGA TATCAATAGC GCAGATATTG CGCTTCGCGT ATCGGCCCTG 
TCAAAGACCT ATCGCATTTA TGGCCGTTCG CAGGACCGGC TGCTGCAAGG CTTGTGGGGT 
AACCGGAAGC AACTGTATCG GGAATTCCGG GCGCTGGACA GCATTTCCTT CGAGATTCGT 
CGCGGGGAAA CTTTCGGCAT CATCGGTCCG AACGGATCCG GGAAAAGCAC GCTGCTGCAA 
CTGATCGCGG GAACGCTGAC ACCCACTCAG GGTGAAATAT ATATCAAAGG CAAAGTCTCG 
GCTTTACTTG AGCTGGGAGC CGGCTTCAAC GGGGAATTTA CTGGCCGCGA GAATATCCGT 
ATGGCGGCAT CGATTGCGGG ATTGAATCCT GGCGAGATCG GACAACGCCA CGAGTGCATC 
GCCGCTTATG CCGACATTGG CGATTTCCTC GATCAACCGG TAAAGACGTA CTCAAGCGGC 
ATGTATGTAC GCCTTGCATT CGCCGTCGCC ATCTCGGTCG AGCCGGAGGT ACTGATCATA 
GATGAAGCAC TGGCGGTGGG GGACATGGAA TTTCAGGCGA AGTGCATGGT GACATTGAAG 
CAGATGCAGG AACGCGGCAC CACCATTCTG TTTGTCAGCC ATGATGTGGG AGCGGTGAGC 
GCCTTATGTA AGCGGACCCT TTATCTCAAG CATGGCCGGG CACTGGAAAT CGGTCCTACT 
CCTGACGTCG TTGCACGCTA TATTCGTGAA GTACAGGAAG CAAACAACCG GAAAATAAAT 
GTAACCGTTT CTGAAAACAA CGATTCGAGA ACCACGAGCC CATCCGACGC TTCTGAGACC 
GGGATCGCTC CCTCCCACCG TACTGCTTCC CTCACCAGCG CTGAGGCCGC ATCTGGAGCC 
GCTTCTGGAT TCTTGACGGC AGCAAGCCCG TTCCGGAGCG TGGAGAAGAA ACATCTTGCA 
CGCTTTGCTG AAAATGCAAA TCACTGCCGC TCGGGAACCG GCGATGTGCG TGTAATTTAC 
GCGGAAATGA CAGATGATGA AGGACTGCCG GTACGCTCGG CAGAATTCGG ACAATCAGTC 
CTCATACGGA TCATCGTTGA AGCCGCCCGC ACCTGTACTT TTTCAGTCAA CTACAAAATT 
TGCGATAAGA ATCGGACGCC GGTGATAGGA GCGGACTTCC TCATGCAAAG GCAGGCGCTG 
CTGACCCTGG AGCCGTCGCA GCAGGCCGAG GCGCTTTACC GGACATCGCT CCCGCTGACC 
GACGGCAGAT ACAGCTTGAG AATTTCACTC ACACACCCCG TCAACGCCCA TCAACAGGCA 
CTGTTCTTCG ATATCGTGGA GATCGCCCAT GTATTCGAGG TGCTGCCCAA TCCGACTGCA 
AAGTTCTGGA CACAGGTTTA TCTGCCGAAT ACGCTCGATG TAAGGGTTCT GGAATGA

Protein sequence

MTAPRELTAE TRCGSSMDSS PPTATDDINS ADIALRVSAL SKTYRIYGRS QDRLLQGLWG 
NRKQLYREFR ALDSISFEIR RGETFGIIGP NGSGKSTLLQ LIAGTLTPTQ GEIYIKGKVS 
ALLELGAGFN GEFTGRENIR MAASIAGLNP GEIGQRHECI AAYADIGDFL DQPVKTYSSG 
MYVRLAFAVA ISVEPEVLII DEALAVGDME FQAKCMVTLK QMQERGTTIL FVSHDVGAVS 
ALCKRTLYLK HGRALEIGPT PDVVARYIRE VQEANNRKIN VTVSENNDSR TTSPSDASET 
GIAPSHRTAS LTSAEAASGA ASGFLTAASP FRSVEKKHLA RFAENANHCR SGTGDVRVIY 
AEMTDDEGLP VRSAEFGQSV LIRIIVEAAR TCTFSVNYKI CDKNRTPVIG ADFLMQRQAL 
LTLEPSQQAE ALYRTSLPLT DGRYSLRISL THPVNAHQQA LFFDIVEIAH VFEVLPNPTA 
KFWTQVYLPN TLDVRVLE