Gene Haur_0628 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0628
Symbol
ID	5732526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	723177
End bp	724667
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	54%
IMG OID	641277755
Product	leucyl aminopeptidase
Protein accession	YP_001543404
Protein GI	159897157
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.052928
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGATTC GTGTAATACA AGGCGATGTT GCTCAACAAG CCGATGCCAT TGTTGTTGTT 
GGTACATGGG CGAATGAGGA ACTGCCTGCC AGCGTTGCTG GTTTAATTGA AGCGAGTGAT 
TGGTCAGGTA AGTACAAAAA AACCACTGTG CTCTATCTTG GCGCACAAGC GACAGGTATT 
CCCGCCTTCG CCAGCCGCCG GGTGCTGTTG GTTGGTTTGG GCAAGCGCGA ATTATGGAAC 
GCTGAGCGTG CTCGCGTCAT CGGGGCAATT CTGGCCCAAC GAGTACGCGA TTTGGGCCTG 
ACGAGCTATA GCCTGCCTTT GCTTGGAAGC GAAGTTTTGG GTGTTAGCCG TAGCGCCGAG 
GCTTTGAGCG AAGGCGCATT GTTGGGTGCT TATCGCTTTG ATGGCTTTAA AACTTTGCCC 
GACGATTTTG TGCCAGCCGT TGCTTTAGAA CAGGTGACGT TGGTTGCCGA AGCTGAGCTT 
GAAGCCGCCG AATTTGGCTC GAAATGGGGC ATTGCGTTGG CTCATGGAGT CAATCTTGCC 
CGCGATTTGG GCAACAATCC GCCAATCGTG GCAACGCCAA CCTACTTGGC CGAAGCCGCT 
CAAACGATCG CCCGTGATTA TGGCATGACC TGTTTGGTGC TCGACCACGA CCAACAAAAA 
GAGTTGGGTA TGGGTGCGTT AATTGGGGTT GCCAAGGGTG CTGCCGAGCC AGCCAAGTTC 
ATCGTTTTGG AGCATGGCCA AGCTGAGCCA GGCAAACCAA CGATTTGTTT GGTCGGCAAA 
GGCATTACCT TCGATACAGG CGGGATTTCG ATCAAGCCAG CCGATAACAT GGACAAAATG 
AAAATGGACA TGCAAGGCGC TGGCGCAGTG ATTGGCACGA TGGAAGCGGT AGGTCGTTTG 
AAATTGCCAA TTCACGTCGT AGCCTTGGTG GCCGCAACCG AAAATATGCC TGGCAGCAAT 
GCCTACAAAC CAGGCGATAT TCTCAAAGCC ATGAATGGCG TAACGATCGA AGTGCTCAAC 
ACCGATGCCG AAGGCCGTTT GGTCTTGGCC GATGCCCTTT CCTATGCCCA AAAATACAAT 
CCCGATGCAA TTATCGACCT TGCAACCCTG ACTGGCGCGT GTGTCGTGGC GCTTGGCTCA 
TATGCCGCAG GCGCAATGAC CAACAATCCA GCTTTGTTGC AACGGGTGCA GCAAGCTGCC 
GAAGGTTCAG GCGATCGGGT TTGGGAACTG CCATTGTGGG ATGAATACCG CCGTCAAGTG 
CGTTCCGATG TTGCCGACAT CAAAAATACT GGTGGCCGCA ACGGTGGGGC GATTACCGCT 
GGGGCGTTCT TGAGCCATTT CGTTGGCGAT TATCCATGGG TCCATTTGGA TATTGCCGGC 
GTGGCATGGA CTGAAGATCA ACCCAAGGAA TACAACCCTA AAGGAGCAAC CGGCTATGGG 
GTGCGCCTCT TGACGGAATT GCTGCGCGAG TGGAGTGGCG TTTCGTTATA G

Protein sequence

MQIRVIQGDV AQQADAIVVV GTWANEELPA SVAGLIEASD WSGKYKKTTV LYLGAQATGI 
PAFASRRVLL VGLGKRELWN AERARVIGAI LAQRVRDLGL TSYSLPLLGS EVLGVSRSAE 
ALSEGALLGA YRFDGFKTLP DDFVPAVALE QVTLVAEAEL EAAEFGSKWG IALAHGVNLA 
RDLGNNPPIV ATPTYLAEAA QTIARDYGMT CLVLDHDQQK ELGMGALIGV AKGAAEPAKF 
IVLEHGQAEP GKPTICLVGK GITFDTGGIS IKPADNMDKM KMDMQGAGAV IGTMEAVGRL 
KLPIHVVALV AATENMPGSN AYKPGDILKA MNGVTIEVLN TDAEGRLVLA DALSYAQKYN 
PDAIIDLATL TGACVVALGS YAAGAMTNNP ALLQRVQQAA EGSGDRVWEL PLWDEYRRQV 
RSDVADIKNT GGRNGGAITA GAFLSHFVGD YPWVHLDIAG VAWTEDQPKE YNPKGATGYG 
VRLLTELLRE WSGVSL