Gene Hhal_2356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2356
Symbol
ID	4709091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2583372
End bp	2584508
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	67%
IMG OID	639856831
Product	sulfonate ABC transporter periplasmic-binding protein
Protein accession	YP_001003921
Protein GI	121999134
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR03427] ABC transporter periplasmic binding protein, urea carboxylase region

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.477529
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCCCGC TTTTGACCCA ACGGCAACCC CGAGGGAGAG ATCCCATGAG CCGCGAACGA 
CGCCCGCTAC GCCAACGACT CACCCACCTG TGCACCGCCG CCGCCCTCCT CGGCACCGCT 
GCACTGCCGC TCGCAGCCAC CGCCGACGAA CGCGACTCCT TCCGCATCGC CTGGAGCATC 
TACGTCGGGT GGATGCCCTG GGGCTACGGC GAGGCCGAAG GCATCGTCGA CAAGTGGGCC 
GACAAGTACG ACATCGAGAT CGATGTGGTG CAGATCAACG ACTACATCGA GTCCATCAAC 
CTCTACACCG CCGGCTCTTT CGACGGCGTC ACCCTGACCA ACATGGACGC CCTGACCATC 
CCGGCGGCCA GCGGCGTGGA TACCACCGCG TTGATCGCCG GCGACTTCTC CGACGGCAAC 
GACGGCGTGG TCCTTGAGGG GACCGACGAC CTGGCCGACA TCGAAGGCCA ACGCGTCCAC 
CTGGTCGAGC TGTCCGTATC GCACTACCTG CTCGCCCGCG CCCTCGACTC GGTGGGGCTG 
AGCGAGCGGG ACGTCCAGGT GGTCAACACC GCCGACGCCG ACATCGTCGG GGCCTTCCGT 
TCCCGCGATG TCCAGGCCGC CGTGGCCTGG AACCCACAGT TGGGCGAGAT CCGCCGACAG 
GACGACGCCC ATGTGGTCTT CGACTCCTCG GACGTACCCG GCGAGATCAT CGACCTGCTC 
GGCGTGCGCA CCGAAGTGCT TGAAGAGCAC CCGGAGCTTG GCAAGGCGCT GACCGGCGCC 
TGGTACGAGA TCATGGACGT CATGTCCGGC GACGATGCCG CCGGCGAGGC CGCTCGCACC 
GCGATGGCCG AGGCGGCGGG CACCGACCTG GCCGGCTACG AGGAGCAGCT CGCCTCGACC 
ACGTTCTTCT ACGACCCCGC CGAAGCGGTG GACTTCGTCA CCAGCGAACA GCCCGCCGAG 
ACCATGGAGA ACGTCCGCCA GTTCGCCTAC CAGCACGGAT TGCTCGGTGA GCGCGCCCCG 
AGCCCGGATT TCGTCGGCAT CGAGCTCGCC GACGGCTCGA CCCTGGGCGA TGCGAACAAC 
GTCCAGTTGC GCTTCACCGA CCGCTTCATG CGCAAGGCCG CCGAAGGCGA GCTGTAA

Protein sequence

MLPLLTQRQP RGRDPMSRER RPLRQRLTHL CTAAALLGTA ALPLAATADE RDSFRIAWSI 
YVGWMPWGYG EAEGIVDKWA DKYDIEIDVV QINDYIESIN LYTAGSFDGV TLTNMDALTI 
PAASGVDTTA LIAGDFSDGN DGVVLEGTDD LADIEGQRVH LVELSVSHYL LARALDSVGL 
SERDVQVVNT ADADIVGAFR SRDVQAAVAW NPQLGEIRRQ DDAHVVFDSS DVPGEIIDLL 
GVRTEVLEEH PELGKALTGA WYEIMDVMSG DDAAGEAART AMAEAAGTDL AGYEEQLAST 
TFFYDPAEAV DFVTSEQPAE TMENVRQFAY QHGLLGERAP SPDFVGIELA DGSTLGDANN 
VQLRFTDRFM RKAAEGEL