Gene Haur_2336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2336
Symbol
ID	5734208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2983555
End bp	2984778
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	52%
IMG OID	641279477
Product	NO3-/NO2-ABC transporter
Protein accession	YP_001545104
Protein GI	159898857
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAAA TCAGCCGTCG CAATTTTCTT AAAACCGCAG CTTCACTTGG TGCTGCCGTT 
GCCATGCCCA GCTTTTTGAC CGCCTGTGGT GGTAGCGAAA GTGCTAGCGA AACTGGTGAG 
CGCCCAATCA AAATTGGCTT TATTCCGCTG ACCGACTGTG CTTCGGTGGT GATGGCACAT 
ACCTTGGGCT TATACCAAAA ATATGGGGTT AACGTTGAGG TGGTTAAAGA GGCTTCGTGG 
GCCAATGTAC GCGATAAGCT GTTAACTGGC GACCTCGATG CTGCCCACTG TTTGTTTGGA 
ATGCCCTTCT CGGTCTACAC TGGTGTTGGC GGCAAGGCCG AAAGCGAACT CAAAATTGCC 
ATGATTTTGA ACCAAAATGG TCAAGGCATT ACGCTCAGCA GTGCCCTCGC CAAAGAGGTG 
GGGTATGGCG ACCCCAGCAA ACTCAAAGCG CTGATCAGCC AACGCCCTGC TGATAAACCC 
GCCACCTTTG CAGGCACCTT CCCAGGCGGA ACCCACGATA TTTGGCTGCG CTACTGGCTT 
GCTGCCGCTG GCGTTGATCA AAATAGCGTC AAAATTATCA CAATTCCACC ACCGCAAATG 
GTTGCCAATA TGCGCATCGG CGAGATGGAT GGCTTCTGCG TGGGCGAGCC ATGGAACGGG 
GTCGCAGTCA AAGAGGGCAT TGGCGAAACT GTGTTAGCAA CCCAAGATCT GTGGGCGGGA 
CACCCAGAGA AAGCCTTGGT GGTCAATCCA AGTTTTGCCG AAAAACGCCG CGATGACCTC 
AAGAAAATCA TGAAGGCCAT CCTTGAGGCC TCAAAATGGC TTGACGATTT CAATAATCGT 
AGCGAAGCCG CTAAAGTTAT TGGCGGTCAA GCCTATGTCA ACGCTCCAGC CGATGTGATC 
GAAGCGCGTT TGAAGGGCCA ATACAACCTT GGGGCAACCT TAGGCGAACG CACGTTTGAG 
CCAAGCAAAA GCATGGTTTT TTATCAGGAT GGTGCGGTCA ATGCGCCGCA ACGCAGCCAT 
GCAATTTGGT TTATGGCCCA GTATGTGCGC TTTGGCCTCT TGCCAAGCGC TCCCGACTAC 
ACCGCCATCG CCGACAAGTT GATTATGCGT GATTTGTATG CTGAAGTCGC CAAAGAAATG 
AGCCTCACCG TGGCAGGCGA CGATTTACAG CCATTCACCG TCACGCTCGA TCAACAAACC 
TTCGATCCCA AAAGCCCATC CTAG

Protein sequence

MSKISRRNFL KTAASLGAAV AMPSFLTACG GSESASETGE RPIKIGFIPL TDCASVVMAH 
TLGLYQKYGV NVEVVKEASW ANVRDKLLTG DLDAAHCLFG MPFSVYTGVG GKAESELKIA 
MILNQNGQGI TLSSALAKEV GYGDPSKLKA LISQRPADKP ATFAGTFPGG THDIWLRYWL 
AAAGVDQNSV KIITIPPPQM VANMRIGEMD GFCVGEPWNG VAVKEGIGET VLATQDLWAG 
HPEKALVVNP SFAEKRRDDL KKIMKAILEA SKWLDDFNNR SEAAKVIGGQ AYVNAPADVI 
EARLKGQYNL GATLGERTFE PSKSMVFYQD GAVNAPQRSH AIWFMAQYVR FGLLPSAPDY 
TAIADKLIMR DLYAEVAKEM SLTVAGDDLQ PFTVTLDQQT FDPKSPS