Gene Nmul_A1552 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1552
Symbol
ID	3785274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1778738
End bp	1779967
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	54%
IMG OID	637811640
Product	aminotransferase AlaT
Protein accession	YP_412247
Protein GI	82702681
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCCCA TTCTCAAATC CAGCAAGTTG GCCAATGTAT GCTATGACAT TCGCGGACCG 
GTGCTCGACC GGGCGCGGCA AATGGAAGAG GAAGGGCACC GTATCATCAA GCTCAATATC 
GGGAATCCGG CATCATTCGG TTTCGAAGCT CCCGAAGAAA TCCTGCAGGA CGTGATGCAT 
AACCTTTCCG CCGCATCCGG TTATTGCGAC TCGAAAGGAT TGTTTGCGGC ACGCAAGGCC 
ATCATGCATT ACACGCAGGA GAAGCGCATC GAGGATGTCC GGCTGGAGGA TATATACATC 
GGCAACGGCG TTTCCGAACT GATCGTGATG GCGATGCAGG CGCTGCTGAA TACGGGTGAT 
GAGGTTTTGA TTCCTTCACC CGATTACCCG TTGTGGACAG CAGCGGTGGT GCTGGCAGGC 
GGGACTCCGC GTCATTATGT GTGTGACGAG CAATCGGGCT GGTTGCCTGA TCTGGAGGAT 
ATTCGCTCGA AGGTGAGCTC GAACACCCGT GCGATCGTTG TCATCAATCC GAATAATCCG 
ACAGGTGCGC TTTATCCGGA CGAAGTGTTG CGTGAAATCA TCGAGATTGC ACGTCAGCAT 
CAACTCATCG TCTACGCCGA CGAAATCTAT GACAAAGTCT TGTACGAAGA TGCGACCCAC 
ACTTCGATTG CGTCCCTGGC GGATGATGTG CTGTTCGTTA CATTGAACGG GTTGTCCAAG 
AATTATCGTG CCGCAGGGTT TCGCTCGGGA TGGGCAGTGG TCTCCGGAAC AAAACACTAT 
GCGAGCGACT ATATCGCTGG TCTGACCATG CTGGCCTCCA TGCGGTTGTG TGCAAATGTT 
CCTTCGCAGT TTGGTATCCA AACGGCGTTG GGGGGGTATC AAAGCATCAA GGATCTGGTC 
ATGCCCACGG GGCGTCTTAT GCGGCAACGC GATCTCGCCT GGAAAATGTT GACGGAGATC 
CCGGGCGTAT CGTGCTATAA GCCACGAGCA GCAATGTATC TGTTCCCCCG CCTGGACCCC 
GCGATCTATC CGATCGAGGA TGACGAGCAA TTTGTGCTGA ATTTACTGTT GGAAGAGAAG 
GTGCTGCTGG TGCAGGGTAG CGGTTTCAAC TGGCCATATC CAGATCATTT CCGTGTTGTA 
TTTCTCCCTA ACAGTGACGA CCTGACTGAA GCCATTAGCC GGGTTGGAAG TTTTCTGGGC 
CGCTACCGCA GGCAGCACGG AACCGGGTGA

Protein sequence

MQPILKSSKL ANVCYDIRGP VLDRARQMEE EGHRIIKLNI GNPASFGFEA PEEILQDVMH 
NLSAASGYCD SKGLFAARKA IMHYTQEKRI EDVRLEDIYI GNGVSELIVM AMQALLNTGD 
EVLIPSPDYP LWTAAVVLAG GTPRHYVCDE QSGWLPDLED IRSKVSSNTR AIVVINPNNP 
TGALYPDEVL REIIEIARQH QLIVYADEIY DKVLYEDATH TSIASLADDV LFVTLNGLSK 
NYRAAGFRSG WAVVSGTKHY ASDYIAGLTM LASMRLCANV PSQFGIQTAL GGYQSIKDLV 
MPTGRLMRQR DLAWKMLTEI PGVSCYKPRA AMYLFPRLDP AIYPIEDDEQ FVLNLLLEEK 
VLLVQGSGFN WPYPDHFRVV FLPNSDDLTE AISRVGSFLG RYRRQHGTG