Gene Nmul_A1557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1557
Symbol
ID	3785279
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1786714
End bp	1788039
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	54%
IMG OID	637811645
Product	ABC transporter, periplasmic binding protein, putative
Protein accession	YP_412252
Protein GI	82702686
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAGGGCA ACCATAAACT GGGTATTCCC CTGATTCTGT TAATTGTTCT CGTGATCATG 
GCGGCGGTGG TATGGCAGTA TCTTGCTGGA AGTAAGCCGA GCATCAGGAT AGGCGTGCTC 
CACTCCCTCT CCGGGGTCCT AGCTGCAAGC GAGAAGCCGT TGATTGATGC AATACAGTTG 
GCCGTTGAGG AGGCCAATGC GGCGGGAGGA ATCCACGGTC ATGAAATTGA AGCTGTGGTA 
GCGGATTGCA GGTCAGACGC GGGTCATTGC GCCCGGGAGG CCGAACGCCT GATTCTCGAA 
GAGAGAGTGG AGGCATTATT CGGTTGCTGG ACTTCTACCT GCCGCAACGC GGTGAAATCG 
GTTGTAGAAC GACACGATCA CCTGCTGTTT TATGCGCTGC GGTATGAGGG TATGGAACAG 
TCGCCTAATA TCATCTACGG AGGTGCAGTA CCAAATCAAT TGGTGATGCC TGCTGTGTAC 
TGGGCCCTGG AAAATCTAGG TAACCGGAAA CATGCACGTC ATAGTGGCAA ACGGGTCTAT 
CTAGCAGGAT CAGAGAATGT TTTTTCGCGA GTCGTGAATA TTCTTATCAA GGATGTTCTG 
GCAGTAAACG GCGGAATCGT AGCGGGGGAA TATTATCTGC CTCTTGGTTC CCAAAACATG 
GAATCTCTTG TAGAGGATAT CGTGGATCAA CAGCCCGATC TGATATTGAG CACGATTGCG 
GGCGCCTATA ACGCCGGGTT CTTTCAAACA TTGAACAGGA GGGGAATCAC AGCGGAGAGC 
ACCCCGGTAT TGTCGTTCAG CGTTACCGAA GTAGTGCTGT CGGGACAGGA TAAGATACCA 
ATGACGGGAC ACTTCGCTGT CCGGAATTAT TTCCAAACCA TTCCTTCGCC GGAGAATCAG 
GCATTCGTCA AGCGGTTCCA CGACCGTTAT GGGGAGCAAG CAGTCGTTGA CAGCCCAGCG 
GAAGCCTCCT ACGTCAACGT GCGCATGTGG ATCCAGGCCG CCGCCGAGGC GGGCTCAGGT 
AACCTGGCAA AGGTACAAAG ATTGATCCTG CGTCAAAGCC TTCCTGCCCC GGAGGGGATC 
GTCGCGCTTG ATCCGGTTAC GCGCCACGCA TGGAAAGTGG CCCGGGTTGG CAAAGTGCGG 
GAAGACGGCC AATTCGATAT TGTGTGGGAT TCCACGCGAC CGCTGGAACC ATCGCCATTC 
CCGTCCTATC GGTCGCGTGA AGAGTGGAAC GTCCTGCTGG AGAAGGTGCT GAACACGCCT 
CCGATCCTGC AGACCACACA ATTCAAGGGA AAACCCGCCG GTGCTTCCCC GAAGCCGGGA 
GGGTGA

Protein sequence

MKGNHKLGIP LILLIVLVIM AAVVWQYLAG SKPSIRIGVL HSLSGVLAAS EKPLIDAIQL 
AVEEANAAGG IHGHEIEAVV ADCRSDAGHC AREAERLILE ERVEALFGCW TSTCRNAVKS 
VVERHDHLLF YALRYEGMEQ SPNIIYGGAV PNQLVMPAVY WALENLGNRK HARHSGKRVY 
LAGSENVFSR VVNILIKDVL AVNGGIVAGE YYLPLGSQNM ESLVEDIVDQ QPDLILSTIA 
GAYNAGFFQT LNRRGITAES TPVLSFSVTE VVLSGQDKIP MTGHFAVRNY FQTIPSPENQ 
AFVKRFHDRY GEQAVVDSPA EASYVNVRMW IQAAAEAGSG NLAKVQRLIL RQSLPAPEGI 
VALDPVTRHA WKVARVGKVR EDGQFDIVWD STRPLEPSPF PSYRSREEWN VLLEKVLNTP 
PILQTTQFKG KPAGASPKPG G