Gene Jann_2343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_2343
Symbol
ID	3934799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	-
Start bp	2349835
End bp	2350995
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	64%
IMG OID	637904701
Product	peptidase M20D, amidohydrolase
Protein accession	YP_510285
Protein GI	89054834
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0732987
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.851404
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCCGTCA TCAATTCCAT CGCCGCCATG GCCCCAGAGA TGAAAACCTG GCGCAGACAT 
CTGCACGCGC ATCCTGAATT GAGCTTCGAC TGCCATGGGA CGGCGGCCTT CGTGGTGGAC 
CGGCTGAAAG CGTTCGGCAT CACCGACATC CATGAGGGGA TCGCGACCAG CGGTCTTGTG 
GCGATCATCG ACAGCGGGCG AGCGGGGCCC ACAATCGGCC TGCGGGCCGA TATGGATGCC 
TTGCCGATCC TGGAGGCGAC GGGGGCGGAG CATGCCTCTA CGGTGCCGGG CAAAATGCAC 
GCCTGCGGCC ATGATGGTCA TACGGCGATG CTTCTGGGGG CGGCGAAATA TCTGGTGGAG 
ACGCGGAATT TCACTGGTCG TGTGGCGTTG ATCTTCCAGC CAGCCGAGGA AGACGGCGGC 
GGCGGGGAGG TCATGGTGCA GGAGGGCGCG ATGGACCGGT TCGACATCAG CCGCGTCTTC 
GCCATCCACA ACATCCCCGG CGCGCCGGAA GGGAGCTTCT TCACCACACC CGGCCCGATC 
ATGGCCGCGG TCGACACCAT TACGGTTGAG ATTACCGGAC AGGGCGGGCA CGGGGCCTAT 
CCGCAGGACA CCATTGACCC GATCCCGCCC GCCATGGCCA TTGCGCAAGG TTTTGGGACC 
ATCGTGTCGC GCAACACCCG CTCCCTCGAC GATCTGGTGA TCTCGGTCAC GCAGATCCAC 
GCAGGCGACG CCAGCAACGT GATCCCGTCC CATGCCATGA TCAATGGCAC CGTCCGCACG 
TTTGATCCAG CAGTGCAGGA CATGGTGGCG CGCCGTATGG GCGAGATCGT CGATGGCACG 
GCCGCGGCCT ACGGCGTCAC CGCCAAGCTG ACCTATGAGC GTGGCTACCC CGCGACCATC 
AATGACCCAG ACCAGACGGC CTTTGCCGTC GGCGTCGCGC AGGAGGTGGT GGGCGAGGGC 
GCGGTCATCG ACAATTCCAA CCGCGAGATG GGGGCGGAGG ATTTCTCCTA CATGCTGCAA 
GCCCGCCCCG GCGCGTATTT GTTTCTGGGC GCGGGCGAGG GTGCGGGGCT GCATCACCCT 
GGATTTGACT TCAACGACGA TATCGCACCA ATCGGGGCCA GTCTGCTGGC AAAAATCGTG 
GAGACGGCCA ATCCCGCATA G

Protein sequence

MPVINSIAAM APEMKTWRRH LHAHPELSFD CHGTAAFVVD RLKAFGITDI HEGIATSGLV 
AIIDSGRAGP TIGLRADMDA LPILEATGAE HASTVPGKMH ACGHDGHTAM LLGAAKYLVE 
TRNFTGRVAL IFQPAEEDGG GGEVMVQEGA MDRFDISRVF AIHNIPGAPE GSFFTTPGPI 
MAAVDTITVE ITGQGGHGAY PQDTIDPIPP AMAIAQGFGT IVSRNTRSLD DLVISVTQIH 
AGDASNVIPS HAMINGTVRT FDPAVQDMVA RRMGEIVDGT AAAYGVTAKL TYERGYPATI 
NDPDQTAFAV GVAQEVVGEG AVIDNSNREM GAEDFSYMLQ ARPGAYLFLG AGEGAGLHHP 
GFDFNDDIAP IGASLLAKIV ETANPA