Gene Lcho_3843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3843
Symbol
ID	6161958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	4306699
End bp	4307952
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	65%
IMG OID	641666616
Product	NO3-/NO2-ABC transporter
Protein accession	YP_001792862
Protein GI	171060513
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGC CCCAAGACCC GGTGACGCCC GTGAACCTGC CGCGACGCGA TTTTCTTCAA 
CGTGCTGCCG CCGTGTCCGG CGCGCTGGCC GTGCCCGGCG GCGCGTGGGC GGCCGGCTCC 
GATGCGCCCG AGAAGAAGGA GGTGCGCATC GGCTTCATCC CGCTGACCGA CTGCGCCTCG 
GTGGTGATGG CCTCGGTGCT GAAGTTCGAC GAGAAGTACG GCATCAAGAT CATCGCGAGC 
AAGGAAGCTT CCTGGGCCGC CGTGCGCGAC AAGCTGGTCA ACGGCGAGCT CGACGCCGCG 
CACGTGCTCT ACGGCCTGGT CTACGGCGTG CATCTGGGCA TCAGCGGCCC CAAGAAGGAC 
ATGGCCGTGC TGATGACGCT CAACAACAAC GGCCAGGCGA TCACGCTGTC GAAGAAGCTG 
GCCGACAAGG GTGCGGTCGA CGGCGCCGGG CTGGCCAAGC TGATGAAGGC CGAGCCGCGC 
GAATACACCT TCGCGCAGAC CTTCCCGACC GGCACCCACG CGATGTGGCT GTACTACTGG 
ATGGCGGCCA ACGGCATCAA CCCGATGACC GACGCCAAGG TCATCGTGGT GCCGCCGCCG 
CAGATGGTGG CCAACATGCG CGTGGGCAAC ATGGACGGCT TCTGCGTCGG CGAGCCCTGG 
AACCACCGCG CCATCATGGA CGGCATCGGC GTGACCGCGG TCACCACGCA GGACATCTGG 
CGCGACCACC CCGAAAAGGT GCTGGGCGCG ACCAACGACT TCGTCACCAA GAACCCGAAC 
ACCGCCCGCG CGATGGTGAT GGCCATCCTC GAGGCCAGCC GCTGGATCGA CACCGGCCTG 
CAGAACAAGA TGAAGATGGC CGAGACGGTG GCCGAGAAGT CGTACATCAA CACCTCGGTC 
GACGCCATCA ACCAGCGCAT CCTGGGCCGC TACCAGAACG GCATGGGCAA GACCTGGGAC 
GACCCGAACC ACATGAAGTT CTTCAACGAC GGCGCGGTCA ACTATCCGTA CGTGTCCGAC 
GGCGCCTGGT TCCTGACCCA GCACAAGCGC TGGGGCCTGC TCAAGGCCGA CGTCGACTAC 
CTCGGCGTGG CCCGCGCGAT CAACAAGACC GAGATCTACA AGCAGGCGGC TGCGCAGGTC 
AAGGTCAACC TGCCCAAGAG CGACATGCGC AGCAGCAAGC TGATCGACGG CGTGGTCTGG 
GACGGCAAGG ATCCGGCCAA GTACGCCGCG GGTTTCAAGA TCAAGGTGGC CTGA

Protein sequence

MTMPQDPVTP VNLPRRDFLQ RAAAVSGALA VPGGAWAAGS DAPEKKEVRI GFIPLTDCAS 
VVMASVLKFD EKYGIKIIAS KEASWAAVRD KLVNGELDAA HVLYGLVYGV HLGISGPKKD 
MAVLMTLNNN GQAITLSKKL ADKGAVDGAG LAKLMKAEPR EYTFAQTFPT GTHAMWLYYW 
MAANGINPMT DAKVIVVPPP QMVANMRVGN MDGFCVGEPW NHRAIMDGIG VTAVTTQDIW 
RDHPEKVLGA TNDFVTKNPN TARAMVMAIL EASRWIDTGL QNKMKMAETV AEKSYINTSV 
DAINQRILGR YQNGMGKTWD DPNHMKFFND GAVNYPYVSD GAWFLTQHKR WGLLKADVDY 
LGVARAINKT EIYKQAAAQV KVNLPKSDMR SSKLIDGVVW DGKDPAKYAA GFKIKVA