Gene Nmul_A1583 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1583
Symbol
ID	3784463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1815459
End bp	1816547
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	55%
IMG OID	637811669
Product	tetratricopeptide TPR_4
Protein accession	YP_412276
Protein GI	82702710
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACGC TCTCGACCGC TTTCTTTTTA GCTCTCGTGC TCGGCATAAC CCAGATTGCT 
TATGCGCAGC AGACAAAGTG GCGGACATTC AGCGAAGAGG CGATATCACT TTACAAGAAG 
GGCGAATATG ACAAAGCGGT AGAAGCCGTC AAGAAATCGC TCGCGGTTGC GGAAAAAGAA 
TATGGCCCTG ACCATCCCGA TACTGCCACC AGTCTGAACA ACCTTGCGGA ATTGTACCGC 
GACCATAAAA AGTTTGCCCA GGCGGAGCCG CTCTATAAGC GGGCTGCGGC AATCCGGGAA 
AAGCACTTTG GACCCAACCA TTCCCTGGTT GCAAGAACCC TGAATGGGCA GGCTGAACTC 
TACCGCGCCC AGAACCGTTT CGGGGACGCC GAGCCGCTTT ACAAGCGGGC GCTGACCATC 
CGGGAAAAAT CCCATAGGCC AGACCATCCG GACATCACGC AGACGCTGAA CAATCTCGCG 
GAACTGTATT GCGTCCAGGA ACGGTACGCG CCGGCTAAAG CGCTTTACGA GCGCTTGCTT 
CCGATACGGG AAAAAGCGCT CGGTTCCGAC CACCCTGGTC TGGCAGCGGG CCTGCACAAT 
CTCGCCTTGA TCCATCAGAA CGAAGGCAGA TACGCACAGG CCGAACCGCT CTACAAACGC 
GTGCTGGCGA TCCGGGAGAA GGCCTTGGGC CGGAATCATC CCGACGTGGC GCAGGATTTG 
AGCATTCTTG CGGAACTTTA TCGCACGCAA GGCCGCTATG CACTGGCTCA GCCCCTTTAT 
GAACGTTCAC TGGCAATCCT TGAAAAAGTT GCCGGAAAGT ATCATCTTGA TGTCGCCACT 
ATCCTGAACA ACCTCGCGTT CATCCATCAC AAGCAGGGGC AGTATGCCCA GGCGGAACCC 
CTTTACAAAC GGGCACTGGC AATCTGTGAA AAGTCTCTGG GCACCGGCCA TCCTACTGCG 
AGAATAACCC GGGATAATCT TGCCGGACTT CGTATCGCAA TGGATCGACT TCCCCCGGAT 
GACGAAACGG AGCAGCGGGT AGCGCAGTCG CGTTTCCAGT GGTTTAGCAA CATTATGGGT 
CGGCCATGA

Protein sequence

MKTLSTAFFL ALVLGITQIA YAQQTKWRTF SEEAISLYKK GEYDKAVEAV KKSLAVAEKE 
YGPDHPDTAT SLNNLAELYR DHKKFAQAEP LYKRAAAIRE KHFGPNHSLV ARTLNGQAEL 
YRAQNRFGDA EPLYKRALTI REKSHRPDHP DITQTLNNLA ELYCVQERYA PAKALYERLL 
PIREKALGSD HPGLAAGLHN LALIHQNEGR YAQAEPLYKR VLAIREKALG RNHPDVAQDL 
SILAELYRTQ GRYALAQPLY ERSLAILEKV AGKYHLDVAT ILNNLAFIHH KQGQYAQAEP 
LYKRALAICE KSLGTGHPTA RITRDNLAGL RIAMDRLPPD DETEQRVAQS RFQWFSNIMG 
RP