Gene Hhal_0447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0447
Symbol
ID	4711470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	513060
End bp	514085
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	71%
IMG OID	639854906
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001002037
Protein GI	121997250
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCGCC TGCTGATGGC CATCGTCGCC GCCGCCGGCG TGGGCGTCGG TTGTGGCGAG 
GATCCCCCAG AGCAATGGCG CATCGCCCTG GAGGAGAAGG CGGGTGGCGT GCAGTACGAG 
TACGCCACCC GCTTCGCCGA AGAGGTCGAG GAGCGGACCG ACGGCGCGGT GGAGGTAAGC 
ATCTACCCCT ACGGCGCCAT CGGCGACACC GAGGCCGTTC ACCAGCAAGT GCGTCGGAAC 
GCGGTGCACT TCGCCTTCGG GTCCGGCGAC CTCGCCGGCG CTGTCCCCGA GAGTCAGGTC 
TTCGGCCTGC ACTTCATCTA CTCCGACGAC GCCTACGTCA ACGCCCGGGC CCTGAACGAC 
CCGGAGCTGC TCCAGAGTAA GGCCCTGCAG GGCGCCTACC AGGACGCGCG GCTGCGGCCG 
CTGGCCCTGG TGCCCGCCGG CTGGCAGGTG TGGGCGGCGC AAGGGCCGCT GGATGAGCCG 
GCGGACTTCC GCGATTTGCG CCTGGGGGTG GCGGACAGCC CGGTGCTGCG CGAGAGCTAT 
CGCGCCTACG GCGCGCGGGC TGAGCACGTC GAGTACGGGG AGCTCCACCA GGCCCTGGTC 
GAAGGGCGGG TGGACGCCAC CGCGCAGCCG ATCTACATCC ACGAGGCGCT CGGGGTCTAC 
GAGCACGCCC GGTACTGGAC CCTGCCCCGG GCGGCGCCGC ACGTCTCCGC CTTTCTGGTC 
AGCGAGATCT TCTACCAGCG CCTGCCGCGC GGGCGGCGGG AGATGCTGCG CGAGATCGGC 
GAGGACCTGG TGGACTGGGC CCACGACATG CAGCAGGCGC TCAACGACGA GCGGCTTGAA 
CAGATCCAGC AGTCAGAGGA TATTGCCCTG GAGGAGCTCG ACGCAGCGCA GCGCGAGGCC 
TTCGCCGATC CGGCCCGCCC CCTCCGTGCG GTCTACACGG CCCGCGGCGG ACCGGACGCC 
GAGCGGATTC TCGCTCGGCT GCTCGATGCC CTGGAGCGCG CCGAGGACGA GCACGGTGGC 
GGCTGA

Protein sequence

MRRLLMAIVA AAGVGVGCGE DPPEQWRIAL EEKAGGVQYE YATRFAEEVE ERTDGAVEVS 
IYPYGAIGDT EAVHQQVRRN AVHFAFGSGD LAGAVPESQV FGLHFIYSDD AYVNARALND 
PELLQSKALQ GAYQDARLRP LALVPAGWQV WAAQGPLDEP ADFRDLRLGV ADSPVLRESY 
RAYGARAEHV EYGELHQALV EGRVDATAQP IYIHEALGVY EHARYWTLPR AAPHVSAFLV 
SEIFYQRLPR GRREMLREIG EDLVDWAHDM QQALNDERLE QIQQSEDIAL EELDAAQREA 
FADPARPLRA VYTARGGPDA ERILARLLDA LERAEDEHGG G