Gene Nmul_A1060 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1060
Symbol
ID	3784880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1225735
End bp	1226652
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	53%
IMG OID	637811144
Product	branched-chain amino acid aminotransferase
Protein accession	YP_411755
Protein GI	82702189
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID	[TIGR01122] branched-chain amino acid aminotransferase, group I

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAATGG CTGACCGCGA CGGTGTGATC TGGAGTGATG GAAAGATGAT TCCGTGGCGT 
GAGGCTACCA CACATGTACT CACCCACACC CTGCATTATG GGATGGGGGT ATTCGAAGGA 
TTGCGTGCCT ACGAAACCCC CCGCGGATCT GCAATTTTCC GTCTGAAAGA ACACACCGAT 
CGTTTGTTCA ATTCCGCGCA CATCTTCATG ATGAAGATGC CCTATGACAA GGCGACGCTG 
ATACAGGCGC AGTGCGATGT CGTAAGGCAG AACGATCTGA AGTCGTGTTA TATCCGTCCC 
ATCGTGTTTT ATGGTTCCGA AGCCATGGGC ATTTCAGCTA AAACGCTTTC GGTGCACGTG 
GCTATTGCAG CTTGGGCGTG GGGCACGTAT CTTGGTCCTG ATGGCCTCGA AAAAGGCATC 
CGTGTCAAGA CTTCGTCATT TACGCGGCAT CATGTGAATA TCAATATGTG CCGTGCCAAG 
TCGGTCACGA CCTATGCAAA TTCCATCCTC GCGCATCAGG AGGTAGCGCA TGATGGCTAT 
GATGAGGCGC TGCTTCTCGA TGTGGACGGC TATGTTGCTG AAGGGGCTGG TGAAAACATA 
TTCATCGTGA AGCAGGGCAA ATTGTATACG CCTGACTTGA CTTCCTGTCT GGAAGGCATT 
ACGCGCGCAT CTCTCATAGA GCTTGCGGAA GAAATCGGAA TCCCGGTTAT CGAGAAGCGC 
ATCACCCGCG ATGAAGTCTA TTGCGCGGAT GAAGCCTTTT TCACCGGCAC CGCAGCCGAG 
GTAACACCAA TCAGGGAACT GGATAACCGC ACGATCGGCA GCGGCAGGCG TGGTCCTATT 
ACAGAAAAGC TCCAGGCCCT CTTTTTTGAA TGTGCCAGAG GCAACGGCAA ACATGCCGAG 
TGGCTCACCC ATGTCTGA

Protein sequence

MSMADRDGVI WSDGKMIPWR EATTHVLTHT LHYGMGVFEG LRAYETPRGS AIFRLKEHTD 
RLFNSAHIFM MKMPYDKATL IQAQCDVVRQ NDLKSCYIRP IVFYGSEAMG ISAKTLSVHV 
AIAAWAWGTY LGPDGLEKGI RVKTSSFTRH HVNINMCRAK SVTTYANSIL AHQEVAHDGY 
DEALLLDVDG YVAEGAGENI FIVKQGKLYT PDLTSCLEGI TRASLIELAE EIGIPVIEKR 
ITRDEVYCAD EAFFTGTAAE VTPIRELDNR TIGSGRRGPI TEKLQALFFE CARGNGKHAE 
WLTHV