Gene Nmul_A1622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1622
Symbol
ID	3784090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1861572
End bp	1862705
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	54%
IMG OID	637811711
Product	transaldolase
Protein accession	YP_412315
Protein GI	82702749
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0176] Transaldolase
TIGRFAM ID	[TIGR00876] transaldolase, mycobacterial type

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.632626
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCCAT TGGAACAGCT ATTGCAATGC GGACAAGCCG TCTGGCTGGA TTCGATCAGT 
CGCGACCTCA TCAAGAGCGG GCAACTGCAG CGCCTGGTAA CCGGAGACAA GCTGCATGGC 
CTGACAAGCA ATCCCACTAT TTTCGAGCAG GCGATCGGGC ACAGCGATGC TTACGACAAC 
GCGCTGCGCC AGCTATTGCG AACCAATGAA AAACAAACCG AAAAGGCCCT GTTCGATGCG 
CTGGCTATCG AGGATATTCG CATGGCCGCA GATGTGTTGC GGTCCGTATA TGATGAAACC 
CATGGTGGGG ACGGGTACGT CAGCCTGGAG GTATCACCCC ACCTGGCACG CGATACCGGA 
GGCAGTATCG CAGAAGCCAA GCGCTTATGG CAAGCCGTGG AGCGGCCCAA TCTCATGATT 
AAAATCCCCG CTACTCCCGA GGGAATTCCA GCAATTGAGC AACTGATAAG CGAAGGCATC 
AACGTCAATG TCACCCTGAT GTTCTCCCTG CGCCACTATG AGGCCGTGGC ACATGCATAC 
ATTACGGGGC TTGAACGCCG TGATGCTTAT TCGCCCGGCG GAAACAAGAT ATGGCCCGTT 
TCGGTCGCCT CTTTTTTTGT CAGCCGGGTG GATAACATAA TCGATCCCAT GCTGGAAAGG 
ATCGGCACCC AGGAAGCGCT CGCCTTGCGC GGGAAAATTG CCATTGCCAA TGCCAAACTT 
GCCTATCAAC GCTTCCGTGA GATATTTTAC GGAGAGCCAT TTGATTCCTG GCGCAAAAAA 
GGTATACACG CCCAGCGGCC ATTATGGGCC AGCACCAGCA CAAAAAATCC TGCATATTCG 
GATGTGTTGT ACGTCGAGGA ATTGGTCGGC CCCGACACCG TCAATACGAT GCCACTCAAA 
ACGCTGGAAG CATTCCGGGA TCACGGGCGG ACTAGCAAAA CCCTTGGAAA AGGACTGGCA 
CAAGCTGAGG CCGACGTGGC CCAGCTTAAG GAGCTGGGGA TCGATCTCAA TGCAGTTACC 
GAAAAACTTC AAAATGACGG AGTCGATTCG TTCGCCGCAT CCTATGACAA GCTTCTTGCC 
TCACTGAGGA AAAAGCGCCA GGAAATTCTC ACTACCAGCG ACCAGACAGC CTGA

Protein sequence

MNPLEQLLQC GQAVWLDSIS RDLIKSGQLQ RLVTGDKLHG LTSNPTIFEQ AIGHSDAYDN 
ALRQLLRTNE KQTEKALFDA LAIEDIRMAA DVLRSVYDET HGGDGYVSLE VSPHLARDTG 
GSIAEAKRLW QAVERPNLMI KIPATPEGIP AIEQLISEGI NVNVTLMFSL RHYEAVAHAY 
ITGLERRDAY SPGGNKIWPV SVASFFVSRV DNIIDPMLER IGTQEALALR GKIAIANAKL 
AYQRFREIFY GEPFDSWRKK GIHAQRPLWA STSTKNPAYS DVLYVEELVG PDTVNTMPLK 
TLEAFRDHGR TSKTLGKGLA QAEADVAQLK ELGIDLNAVT EKLQNDGVDS FAASYDKLLA 
SLRKKRQEIL TTSDQTA