Gene Hhal_1137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1137
Symbol
ID	4710121
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1236536
End bp	1237846
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	72%
IMG OID	639855609
Product	amine oxidase
Protein accession	YP_001002715
Protein GI	121997928
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.858264
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCGGG AGAATCCGCA AGTAGTTGTC ATCGGCGCCG GCCTGGCCGG CCTCGCCGCA 
GCACGTGATC TAGCGGCCGG CGGCGCCCGT GTGGAGTTGC TGGAAGCCGG CGACGAGGTA 
GGCGGACGCG TTCGCACCGA CCGCCTGCGG CTGGACGGCA GCCCGGCGAG CGGCGAGGAG 
CCGGCCTTCC AGCTCGACCG CGGTTTCCAG GTGCTACTGA CCGCCTACCC GGAGCTGCGC 
AGCCGCGCCG ACCTGGACGC GCTGCAGCTG CGCCGGTACG CCCCCGGCGC CCTGATCCGC 
ACCGAGGGCG GACTGCACCG GCTCAGCGAT CCGTTCCGCG CCCCGCAGGC GCTGCTGAAA 
ACCCTACAGG CCCCGGTGGG CAGTCTCGGC GACAAGCTAC GCATCGCCCG CCTGCGGGCC 
CGCCTGCGCC GCGGCGATGC CGAGCGTCCC CTGTACGGGC CGCAGCAAAG CAGCGCCGAA 
GCCTTCGCCG CGGAGGGCTT CTCGGCACGG ATGGTCGAGC GCTTCCTGCG GCCGCTATTC 
GGCGGCGTTC TCCTCGACCC CCAACTCCAG ACCTCGGCCC GACTGCTGAA CTTCGTCTTC 
CGCATGTTCG CCGAGGGCGA TGCAGCCATC CCCGCCGGCG GCGTCGGCGA CCTGCCGCGC 
CAGCTGGCTG CTCAACTCCC CGCCGACCGG GTGAGGCTGC GCCTTGGGAC TGCCGCACAG 
GGCATTGAGC AGGGCCCCAT CGTATCGCTG GCGGGTGGCG AGCAACTGAG CGCCGATGCC 
GTCGTGGTCG CCACCGACGG GCCAGCCTTC ACCCGTCTGA CCGGGCACCC CACCGCCGCG 
GGCCGGCCAG TAACCTGCCT GCAGTTCGCC GCGCCGGAAC CGCCGGTGAC CGAACCGTTG 
ATCGTACTCA ACGGCGAGGG GGAAGGGCCC ATACTGCACC TGGCGGCACC CAGTGTGGTG 
GCCCCCGAAT ATGCGCCGCC TGGCTGGCAC CTGGTCAGTG CCACTGTGCT CGGCGAGGGG 
CAGGACCGGG ACGACCCCTC CCTACAACGC GAGGCCGTCA GACAGTTGCG CGACTGGTTC 
GGGCCGGGGG TGGATCACTG GCGCCCGCTG CGCCTGGAAC GCATCCCCTA CGGACAGCCG 
GTTCAGACGC CGCCGGCGCT GACCCACCCG TACCAGCCGG CGCGGCTCGG AGGTGACATC 
TACGCCTGCG GCGATCACCG CGCCCACGGA TCCCAGCACG GCGCATTACG CTCGGGCGCA 
CTCGCCGCCG ACGCGGTGCT TGCCGATCAG GGAGGGGGAT CTGCCGCCTA G

Protein sequence

MPRENPQVVV IGAGLAGLAA ARDLAAGGAR VELLEAGDEV GGRVRTDRLR LDGSPASGEE 
PAFQLDRGFQ VLLTAYPELR SRADLDALQL RRYAPGALIR TEGGLHRLSD PFRAPQALLK 
TLQAPVGSLG DKLRIARLRA RLRRGDAERP LYGPQQSSAE AFAAEGFSAR MVERFLRPLF 
GGVLLDPQLQ TSARLLNFVF RMFAEGDAAI PAGGVGDLPR QLAAQLPADR VRLRLGTAAQ 
GIEQGPIVSL AGGEQLSADA VVVATDGPAF TRLTGHPTAA GRPVTCLQFA APEPPVTEPL 
IVLNGEGEGP ILHLAAPSVV APEYAPPGWH LVSATVLGEG QDRDDPSLQR EAVRQLRDWF 
GPGVDHWRPL RLERIPYGQP VQTPPALTHP YQPARLGGDI YACGDHRAHG SQHGALRSGA 
LAADAVLADQ GGGSAA