Gene Hhal_1441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1441
Symbol
ID	4711161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1552480
End bp	1554465
Gene Length	1986 bp
Protein Length	661 aa
Translation table	11
GC content	70%
IMG OID	639855908
Product	peptidase M1, membrane alanine aminopeptidase
Protein accession	YP_001003010
Protein GI	121998223
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0308] Aminopeptidase N
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.51284
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCAGGC CTACCCGGAT CCTCGCCGCT CTCCTTCTCG CCGCCCTGCC GGCGGCGGCC 
GTGGCCGCGT GGCCCGACAC CCCTCAAGCC GAGATGGACG TTCGGCTGCA CCCCGAAGAC 
GGCCGCCTGG AGGGGCGCAT GGCCCTGCGA TTGCCGGACG AAGAGCCGCT GTCCCTGGCG 
GTTGGCCCAG GGTTTCGGAT CGATCAGACC GAACTGACCG CCGGAAGGGT CGAGACCCTA 
GGTCAGCGGG GCGTCATCCT GCATCCGGAC GAGGCCACCG AAGCCCGGCT GCGCTGGTCC 
GGCGAACCCG ACGGACAGGG CCGGGGCAGC CACCTGCACA CCGAGGGGGC CTGGCTCGAG 
GCGGCAGCCG GCTGGCACCC CCGTCCGGCA TCGCGGCGGA TGGGCTACCG GCTGATCATC 
GCTGTGCCCG AGCCGCTCCA AGTGGTCGCC GAGGGGACGC GGGCCGAGGA GCAGAGTGAG 
GACGGACTGC GCCGCGTCGA ATTCCACCAC CCGGCACCGG CACTCGGCAT CGCCCTGTTC 
GCCGGCGAGT GGCAGCACCG CACCCGCGAG GCTCGGCACG GGACCGTCCA CACCTTCTTC 
CCGGAGACCC TGGCGGAGCA CCACGAGACC TATCTGGAAC GCACCGCGGC CTACCTGGAC 
GAGTACAGCG AGTGGATCGG CCCACCCCCA CACGAGACCT TCTCGGTGCT GGCCACTCCC 
TACCCCGTGG GGCTGGCCTT CGCCGGATTC ACCGCCCTGG GCGAGCAGGT GATCCCCCTG 
CCCTTCATCC CGGACACCTC GCTGCCCCAC GAGGTCGTCC ACAACTGGTG GGGACGCGGC 
GTCTACACCG ACTATGACGA CGGCAACTGG AATGAAGCGC TGACCTACTA CATGGGCGAC 
TACCACCAGG CCCTGCAGCG GGATATCGAC GAGGCCCGCC GCCTGCGTGG TGACTGGTTG 
CGCAGCCAGG CCGCCCTCCC CGAGGTAGCC GACTACCCGC TGGGCGAGTT CCGGCACAAT 
CGCGGCTCGG CGGATGAGAT CGTCGGCTAC CAGCGCGGCG CTTCCCTCTT CCACACCCTG 
CACCGCACCC TGGGGGAGGC GGGCTTCGAC GAGGCGATCC GCCGGTTCTA TGAGCAGCAA 
GTCCACCGTG AGGCCGGCTG GCCGGATCTC GAGGCCACCT TCAGCGACGC CGCCGAGGCC 
GACGACGCTG AGACCGAAAC GATCCAGGCG CTCTTCCGGT GGTTCCTTTC AGCCACCGAG 
CTCCCAGACC TTGAGATGGA CGAACGCACG CTGACCGTTG CCCGCGACGG CGACGACCGG 
TACCGGGTCG AGGTCGAGAT CGACTGGGAC GAGGAAGGCT ATCCGGTCTC CATCCCGGTC 
GCCCTCAAGG GCGACGAGGG CCGACTGAAC GAGCAGGAGA TCCACCTGCA GCCCGGAGAG 
CGCACCCGCA TCGAACTCGC CAGCGAAACG CGCCCCCGCT ACCTGCAGGC CGACCCCGAT 
CAGCATGTGT ACCGACAATT GGCCCTGGGC GAGGGGGTGG CCATCCTACG TGACACCCTA 
CTGGCGGAAT CTGTGACCCT GGTCAGCGCC TGGGAAGACC TGGAGGCAAC CGCCAACCAG 
GCTTTGCGCG GCGATGTCGA ACCCGGCGAA CCCGACCGGG ATCGCCCGCT GTTGATCGTG 
GCGCCCCGAG AGGCCGTCGG CGAACACCTG GAGGCGGCGC AGTCGTGCAT CACCGAGCGC 
ATCCGCCCCG TGGACCACGA CACCGTCGCC TGGGCCAGCA CCACCGGTGG CGGACAACCG 
CTGATCGTCC TCGCCGCTAA GGATCGAGAG CAGGCGCGCC AGGCGCTGCA GCGTCTGGCG 
CGCTACGGCC GCCACAGCTA CGTCGGTTTC GGCAGTGCCC GCGGCGACGC CGAGACCGGA 
CTCTACGAAC CCGCCGATCG CCACGGTCTG CGTCTACCGC TGGCCGATCA GTTCGACGGC 
GACTGA

Protein sequence

MRRPTRILAA LLLAALPAAA VAAWPDTPQA EMDVRLHPED GRLEGRMALR LPDEEPLSLA 
VGPGFRIDQT ELTAGRVETL GQRGVILHPD EATEARLRWS GEPDGQGRGS HLHTEGAWLE 
AAAGWHPRPA SRRMGYRLII AVPEPLQVVA EGTRAEEQSE DGLRRVEFHH PAPALGIALF 
AGEWQHRTRE ARHGTVHTFF PETLAEHHET YLERTAAYLD EYSEWIGPPP HETFSVLATP 
YPVGLAFAGF TALGEQVIPL PFIPDTSLPH EVVHNWWGRG VYTDYDDGNW NEALTYYMGD 
YHQALQRDID EARRLRGDWL RSQAALPEVA DYPLGEFRHN RGSADEIVGY QRGASLFHTL 
HRTLGEAGFD EAIRRFYEQQ VHREAGWPDL EATFSDAAEA DDAETETIQA LFRWFLSATE 
LPDLEMDERT LTVARDGDDR YRVEVEIDWD EEGYPVSIPV ALKGDEGRLN EQEIHLQPGE 
RTRIELASET RPRYLQADPD QHVYRQLALG EGVAILRDTL LAESVTLVSA WEDLEATANQ 
ALRGDVEPGE PDRDRPLLIV APREAVGEHL EAAQSCITER IRPVDHDTVA WASTTGGGQP 
LIVLAAKDRE QARQALQRLA RYGRHSYVGF GSARGDAETG LYEPADRHGL RLPLADQFDG 
D