Gene Haur_2393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2393
Symbol
ID	5734274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3049579
End bp	3050622
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	53%
IMG OID	641279534
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001545161
Protein GI	159898914
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAAAA CTGTGTTAAC TGCTGAGCAG TGGAAATTAG CTGAATCTCC CGACCCGGTG 
GTCTTGGAAG TGCGCAATTT GACCAAACGC TTTCCAGTTG GTGGTCTGTT TCGCAGCAAA 
CAGGTCCATG CCTTAACCGA TGTGTCATTT GCAATTCGCC GTGGTGAGGT GTTGGCGGTC 
GTGGGCGAAT CAGGCAGCGG CAAAAGCACC GCCGCTCGGT TGATCGCTCG CTTGATGGAG 
CCAACCAGTG GCGAGATTAT CTTCCGTGGC CAAAATGTGC TGCAAACTGA GAAACGTGGT 
GCTTCGCTGA GCTATCGCAG CGGCGTACAA ATGATTTTTC AAGATCCATT TGGCTCGATG 
AACCCAACCC ACTCGGTGGC GCATCACATT ATGCGACCAT TGCAAATTCA TCATAAAGTT 
GAGCGACGCA GCGATTTGTT GCCACGAGTG CATGAGTTGC TGGCGACGGT CGGCCTGAAT 
CCACCAGCCG ATATTGCCAA TAAATACCCA CACGAGTTAT CTGGTGGGCA ACGTCAACGG 
GTGGCGATCG CCCGCGCCTT GGCCGTTGAT CCGGAAATCG TGCTGGCCGA CGAACCAATT 
TCGATGCTCG ATGTTTCGAT TCGGATTGGC GTTTTGAATT TGATGGCCAA GCTCAAAAAA 
GAGATTGGCA TCGGCTACCT CTACATTACC CACGATATTG CCAGCGCCCG CTATTTTGCC 
GACCGGATTA TGGTGTTGTA TGCAGGCCAA ATGATGGAAG GTGCTGATAG TGACGAGTTG 
ATCGGCAACC CCGCCCATCC CTATACAAAA TTGTTGCTTT CGGCTGTGCC AAACCCCGAA 
GTGGCGCTTG GTCAGCGTGA AGTTGTCGCC CGTGGTGAGC CGCCTTCCTT GATCGATCCG 
CCGCCTGGTT GCCCATTTGC GGCGCGTTGC CCTCAAGTCA AGGATGTTTG TCGTAAAGTA 
ATGCCCGATG TGCAGACGAT TGCGCCAAAT CACTGGGTTC GTTGCCATTT GTATGGTGAG 
GGCACTGGAG GAACTGCGGC ATGA

Protein sequence

MTKTVLTAEQ WKLAESPDPV VLEVRNLTKR FPVGGLFRSK QVHALTDVSF AIRRGEVLAV 
VGESGSGKST AARLIARLME PTSGEIIFRG QNVLQTEKRG ASLSYRSGVQ MIFQDPFGSM 
NPTHSVAHHI MRPLQIHHKV ERRSDLLPRV HELLATVGLN PPADIANKYP HELSGGQRQR 
VAIARALAVD PEIVLADEPI SMLDVSIRIG VLNLMAKLKK EIGIGYLYIT HDIASARYFA 
DRIMVLYAGQ MMEGADSDEL IGNPAHPYTK LLLSAVPNPE VALGQREVVA RGEPPSLIDP 
PPGCPFAARC PQVKDVCRKV MPDVQTIAPN HWVRCHLYGE GTGGTAA