Gene Haur_4630 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4630
Symbol
ID	5736477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5916744
End bp	5917796
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	51%
IMG OID	641281794
Product	peptidase M19 renal dipeptidase
Protein accession	YP_001547389
Protein GI	159901142
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCTCG TTGATGCACA CCTCGATTTG GCTTATAACG CAATTAACCT TGGCCGCGAT 
TTGACCAAAA CCGTGGAACT TGGCCGCCAA CGTGCAACCG AACAAACCGT TGAATGGATT 
GCTGAGGCTG GTACCTTGAC CACTACCTTG GCTGAAATTG GCTTGCACAC GCCAAGTATT 
GTGTGTGGCA CAATTTTTAT TCTGCCAGCG GAAGCCCAAA CTACGCTTGA TGGCGTGGCC 
TATGCTACCC CCGACGAAGC CCACGATCAA GCGTGGGAGC AACTAAATTG GTATAAACAA 
CAATGTGCCG CTGGCTTTTT GCACCTTATC GACAATCAAC CAGCCCTCCA AGCGATTCAA 
GCTCGCAACC AATCAGTGCC AGGGTTGGTC TTGTTGATGG AAGGAGCAGA TGGCTTGCGC 
ACGCCCGATG AACTAATCGA GTGGTATGCT GCGGGTTTGC GCTGGCTTGG CCCAGCATGG 
CAAGCAACTC GCTATGCTGG TGGCACTGGT GCACCAGGCT CATTGACCAA ATTGGGCTTG 
GAATTATTGG AATTGATGCA AAGATTAGGC GTGGCGCTCG ATGCCAGTCA TTTGGCAGAG 
GAAAGTTTTT GGCAAGCACT TGAGCACTTT CAAGGGCCAA TTGCGGCCTC GCACTCCAAT 
TGTCGCAGCT TATTAGTTGG AGCCAGCCAC CAAGATCGCT ATTTAAGTGA TGAGATGATC 
AAAGCGATTA TTGAGCGTGA TGGCGTGATT GGAATTGCAC TCTACAACCG TATGCTGCGG 
GCCGATTGGG ATGGTAGCAA AAATCATGTC TCGTTGGAGC ATGTGGTGAT GCAAATTGAG 
CATATCTGTC AGCTGGCAGG CAATACGCAG CATGTGGCGC TTGGCTCCGA CCTCGACGGT 
GGCTTTGGAG TTGAGATGAT TCCGGCTGAA ATTGATCGCT GGAGCGATTT ACTAAAGATC 
GGCCAAGCCT TAGCGAAGCG GGGCTGGCAC GAAAATGATA TTGCCAAGGT GCTCGGCCAA 
AATTGGCTGC GTTGGTTTCA ACGAATTATC TAG

Protein sequence

MILVDAHLDL AYNAINLGRD LTKTVELGRQ RATEQTVEWI AEAGTLTTTL AEIGLHTPSI 
VCGTIFILPA EAQTTLDGVA YATPDEAHDQ AWEQLNWYKQ QCAAGFLHLI DNQPALQAIQ 
ARNQSVPGLV LLMEGADGLR TPDELIEWYA AGLRWLGPAW QATRYAGGTG APGSLTKLGL 
ELLELMQRLG VALDASHLAE ESFWQALEHF QGPIAASHSN CRSLLVGASH QDRYLSDEMI 
KAIIERDGVI GIALYNRMLR ADWDGSKNHV SLEHVVMQIE HICQLAGNTQ HVALGSDLDG 
GFGVEMIPAE IDRWSDLLKI GQALAKRGWH ENDIAKVLGQ NWLRWFQRII