Gene Haur_0351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0351
Symbol
ID	5732261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	421892
End bp	422866
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	50%
IMG OID	641277474
Product	ABC transporter related
Protein accession	YP_001543130
Protein GI	159896883
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1125] ABC-type proline/glycine betaine transport systems, ATPase components
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0304446
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCACAA TCGAGTTTCG CAATGTTCGT AAAATCTACC CCAAGGCCGC AACCGCCGCG 
CTCGCCGATA TTTCTCTGAC AATCAATCGC GGTGAATTTG TGATTTTGCT TGGGCCTTCG 
GGCTGCGGCA AAACCACGCT CATGAAAATG ATCAATCGCT TGATCGAGCC AAGTAGCGGC 
ACAATTTTGC TCGATGGAGT CGATATTCAG TCGATTAATG CCACGAAATT GCGCCAGCAA 
ATTGGCTATG TGATTCAGCA AGTTGGGCTT TTTCCGCATA TGACGGTCGC TGAGAATATC 
GCAGTTGTCC CCAAATTGCT TGGCTGGCCC AAAGCCAAAA TCCAAAGCCG CATCGACGAA 
TTACTCCAGC TCATTCAGCT TGATCCTGCC CAATTTCGCC AGCGCTACCC GGCCCAAATT 
TCCGGTGGGC AAGCCCAGCG CGTTGGTTTG GCCCGTGCTT TGGCCGCTGA TCCTGGGGTG 
ATGTTGATGG ATGAACCATT TGGCGCGATC GATGCGATCA CCCGCACGGC CTTGCAAGAT 
GAGATGCTGC GCATTCAGCA GCAATTGCAG AAAACTATCG TTTTTGTGAC TCACGATGTT 
GAAGAAGCGC TTCGCTTAGC TGATAAAATT GCAATTCTGC ACGAAGGCAC GATCGTTCAA 
TACGATACTC CGCTCAATTT ATTGCGTAAT CCCGCTAATC ACTATGTCGC TGAGTTACTG 
GGAGCCGATG ATTTGGTGCG CCGTTTGAGT TTAATTCAGG TGCGCCATGT GCTTCAACCA 
CTGCCTGCAA GCTATGATTC CTCGTTAGCA AGCATCGAAA GTAGCCGCAA CCTGCGCGAT 
GGGCTGAATC AACTCCTCGC CAGCAGCGAC GAACAATTGT TGGTCGTTGA ACACAATCAA 
CCAATTGGTA TGCTCTCATT AGCCGCAATT CATGCCTATT TGCACCCTGA GGTCATCCAT 
GAACGACATC GTTGA

Protein sequence

MSTIEFRNVR KIYPKAATAA LADISLTINR GEFVILLGPS GCGKTTLMKM INRLIEPSSG 
TILLDGVDIQ SINATKLRQQ IGYVIQQVGL FPHMTVAENI AVVPKLLGWP KAKIQSRIDE 
LLQLIQLDPA QFRQRYPAQI SGGQAQRVGL ARALAADPGV MLMDEPFGAI DAITRTALQD 
EMLRIQQQLQ KTIVFVTHDV EEALRLADKI AILHEGTIVQ YDTPLNLLRN PANHYVAELL 
GADDLVRRLS LIQVRHVLQP LPASYDSSLA SIESSRNLRD GLNQLLASSD EQLLVVEHNQ 
PIGMLSLAAI HAYLHPEVIH ERHR