Gene Hhal_2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2043
Symbol
ID	4710017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2246108
End bp	2247316
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	73%
IMG OID	639856516
Product	protein of unknown function Met10
Protein accession	YP_001003609
Protein GI	121998822
COG category	[R] General function prediction only
COG ID	[COG1092] Predicted SAM-dependent methyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.338836
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCAAC GACCCGCACT CCGCCTGAAA CCCGGCGAGG AGCGCCGCCT GCGCGCCGGC 
CACCTGTGGA TCTTCAGCAA CGAGGTGGAT ACCGCCCACA CCCCGCTGCG GGGGTTCGCG 
CCCGGCGAGC AGGCCGTGGT GGAGGACGCC CGCGGCAAGG CCCTGGGGTG CGCCTACGTC 
AACCCCAACT CGCTGATCTG CGCCCGGCTG GTCAGTCGCG ACGCCAAGGT GGCCCTGGAT 
CGCTCGACCC TGGTCCACCG CCTGCAGGTG GCCCTGGCCG CACGCCAGCG CCTCTTCGCC 
GAGCCCTGGT ACCGGCTGGT CCACGGCGAG GCCGATGGCC TGCCCGGCCT GGTCATCGAC 
CGTTTTGGGG ACTGCTGTGT GGTGCAGCCG AACACCGCCG GGATCGAGCG GTTGCAGGCC 
GAGGTGCTGG AGGCCCTGGA GAAGGTCGTC GCCCCGGCGT ACGTCCTCTG GCGGGCCGAC 
AACGCCGTGC GCGAGCGCGA GGGGCTGGAC CTGCGCGTGG AGTGGCTCGG CCAGCCGGGG 
CCGGAGGAGC TGGAGGTCCG CGAAGGGGGG CTGCACTTCC GGGTCCCGGT GGTCAGCGGG 
CAGAAGACGG GTTGGTTTTA CGATCAGCAG GCCAATCGCC GGCGCCTGGC CGCCTACGCC 
GGCGACGCCC GGGTGCTGGA CGCCTTCTCC TACGCCGGCG GCTTCGCCAT CGCCGCCGCG 
GTGGCCGGCG CCCGCGAGGC GGTGGCCGTG GAGCGCTCCG CCGAGGCGTG TGACCGCATC 
GCCGCCAATG CCGAGCGCAA CGGCGTCGGC GATCGGGTGA CGGTGATCGA AGGCGAGGTC 
AACGACTACC TGGCGGCGGC CCGTCAGGAG GGCGAGCGCT ACGACGTGGC GGTGGTGGAT 
CCGCCGGCGT TCATCAAGCG CCGCCGCGAC CGCAAGGCCG GTGAGCGCGG CTACCGCACG 
GTCAACGAGG CGGCCCTGCG CCTGCTCGGC CGCGACGGCG TGCTGCTCAG CTGCTCCTGC 
TCGGCCCACC TGCCCGAGGA GCGCCTCTCC GGCATCCTGC TGGCGGCCGG GCGGCACCTG 
GACCGCTCCG TGCGCATCCT CGAGCGCGGC GGTCTGCCGC CGGACCACCC GATCCACCCG 
GCGATCCCCG AGACCGACTA CCTCAAGGCG CTCTTCATCC GTGCGGTGAT CGCCACCAGC 
CTGCCGTGA

Protein sequence

MQQRPALRLK PGEERRLRAG HLWIFSNEVD TAHTPLRGFA PGEQAVVEDA RGKALGCAYV 
NPNSLICARL VSRDAKVALD RSTLVHRLQV ALAARQRLFA EPWYRLVHGE ADGLPGLVID 
RFGDCCVVQP NTAGIERLQA EVLEALEKVV APAYVLWRAD NAVREREGLD LRVEWLGQPG 
PEELEVREGG LHFRVPVVSG QKTGWFYDQQ ANRRRLAAYA GDARVLDAFS YAGGFAIAAA 
VAGAREAVAV ERSAEACDRI AANAERNGVG DRVTVIEGEV NDYLAAARQE GERYDVAVVD 
PPAFIKRRRD RKAGERGYRT VNEAALRLLG RDGVLLSCSC SAHLPEERLS GILLAAGRHL 
DRSVRILERG GLPPDHPIHP AIPETDYLKA LFIRAVIATS LP