Gene Haur_1226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1226
Symbol
ID	5733119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	1418710
End bp	1419783
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	52%
IMG OID	641278366
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001544002
Protein GI	159897755
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGAAG CACCCTTGCT TGAGGTCAAA AACCTACAAG TTCAATTTAA AACTGCTGAT 
GGCGTGGTCA ATGCTGTCAA TAATGTTTCA TTCTCGGTCA ATCGCGGCGA AACCTTAGGC 
ATCGTCGGCG AATCTGGCTC AGGCAAAAGC GTGACATCAC TTTCGATTAT GCGCTTGATT 
CCCTCGCCCC CAGGCAAAAT TGCTGGTGGC CAGATTTTAT TTGATGGTGA TAATCTTGTC 
GATTTTAGCG AGTCGGAGAT GCGTAAAATC CGTGGCAATC GGATTTCGAT GATCTTCCAA 
GACCCCATGA CTTCGCTCAA TCCGGTGCTA CGGATTGGTC GGCAGATGAC TGAATCGCTG 
CAATTGCACA TGGGGATGAC TCCCAAACAG GCGCGAAACC GAGCCATTGA CTTGCTCTCA 
ATGGTTGGGA TTCCAGCTCC TGACAAACGG CTTGATGATT TTCCCCATCA ATTTTCTGGC 
GGGATGCGCC AACGGGTGAT GATCGCTATG GGTTTGGCTT GTAACCCTGA GCTATTGATC 
GCCGACGAGC CAACGACAGC ACTCGATGTA ACTATTCAAG CGCAAATTCT CGAATTGCTT 
AACCGTCTGA AGAACGAGAC AGGCACGGCG ATTATTTTTA TCACCCACGA CCTTGGCGTT 
GTGGCGGGCA TGACCGATCG GGTGATTGTG ATGTATGCTG GACGGGTGGT CGAACAGGCC 
TCAACCAACG AGCTGTTCCA TAATCCCCGT ATGCCTTACA CCATCGGTTT GCTCGATTCG 
ATTCCCCGGC TTGATGGAAT CCAAACGCGC CTTACGCCAA TCCCAGGGCT ACCACCGGAT 
TTGCTGGAGA AAACCGAGCG CTGCCCATTT GCACCGCGCT GCGATTTTGT GCAAGAGCAA 
TGTTGGAGCG AAACGCCGAG TTTGCGCCAA GTTGCGCCTG AGCATACCGC TGCCTGTTTA 
TTCGAGATAG ATCGGGAACA GCGCCAAGCG ATGGCCGCCA AGAAGATTGC CGAAGAACAA 
GCCGCCTTGG ATGCTGCGCT TGAAGATGTT TTAGCCCACG AACAGGCATC GTAG

Protein sequence

MAEAPLLEVK NLQVQFKTAD GVVNAVNNVS FSVNRGETLG IVGESGSGKS VTSLSIMRLI 
PSPPGKIAGG QILFDGDNLV DFSESEMRKI RGNRISMIFQ DPMTSLNPVL RIGRQMTESL 
QLHMGMTPKQ ARNRAIDLLS MVGIPAPDKR LDDFPHQFSG GMRQRVMIAM GLACNPELLI 
ADEPTTALDV TIQAQILELL NRLKNETGTA IIFITHDLGV VAGMTDRVIV MYAGRVVEQA 
STNELFHNPR MPYTIGLLDS IPRLDGIQTR LTPIPGLPPD LLEKTERCPF APRCDFVQEQ 
CWSETPSLRQ VAPEHTAACL FEIDREQRQA MAAKKIAEEQ AALDAALEDV LAHEQAS