Gene Jann_2048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_2048
Symbol
ID	3934501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	2052723
End bp	2053838
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	65%
IMG OID	637904404
Product	peptidase M24
Protein accession	YP_509990
Protein GI	89054539
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.402173
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.837706
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACATCT ACAAAACCCG CCTCGCGCGC TTGCGGACCC GCATGGCCGA GACCGGCACC 
GACCTTGTGG TCCTTGGCCC CACCAGCCAC ATGGCGTGGC TATCGGGCGC GGATCCCCAT 
GGCGATGAAC GTCCCGTGAT GCTGCTGGTC AGCCAAAGCC ATGCCGGGTT TCTGATGCCC 
GCGCTCAATG CCAATTCCGT GCGGCAGGCC ACCGATCTAC CGTTCGAACC CTGGACCGAT 
GAAGCCGGTC CGACCGACGC CCTGGGCCGG TTACTGGAGG TCTGCAACAT CTCTGGCCCC 
GGCAAGACCG TGGCGCTGGA CGAGGCGATG CGCGCCGATT TCGCGCTGCT TCTGCTGGAC 
GCGATGGAGG CCCCTGTGCG GCGGTTCTCC GGCGATACTC TGGGCCATTT GCGCGCGATG 
AAAGACACCG CTGAGGTCGA GGCTTTGCGC ACCTGCGCGC ATCTCAACGA TGCGGCCGCC 
TCCGCCGGGT TTGCGTCACT GCGCGCTGGC ATGACCGAGC GGGACGTGGC CACGATTATC 
CGCGACCATT ACGTGGCCCA TGGCGCGAAG CCGGAATTCA CTATCGTGGC CTTCGGCGCA 
AACGGCGCGT TCCCCCATCA CCATACCGGC GACACGGTTC TGCACGACGA TATGGCCGTG 
CTGATTGATA CAGGCTGCCG GATCGGCGGC TATCCCAGCG ATATGACCCG GTGCGGTTGG 
TTCGGCTCCG CACCCTCAGC CGAGTTCCTT CGTGTGGCGG ATGTGGTCGA GCGGGCGGTG 
CAGGCCGCCA TCGCGGTCGT GTGTCCCGGT GTCCTTGCCC GAGAGATAGA CGCGGCGGCA 
CGGGGCGTGA TTGAGGATGC GGGTTATGGC GACTTCTTCG TGCACCGCAC CGGTCATGGC 
CTTGGGCTGG ATATCCATGA GCCACCATAC ATCACGGCCA CATCCGACAC CCTGATGCAG 
GCGGGCCATG TCTTCTCCAT CGAGCCGGGG ATTTACCTGC CGGGACAGTT TGGCCTGCGG 
CTGGAGGACA TCGTCATCGC GACCGACACC GGCGCGGATG TCCTGTCGGC CCTTCCGCGC 
ACGATCGTGA CATCTGTGGA TGGCCCGGCC AGCTAA

Protein sequence

MDIYKTRLAR LRTRMAETGT DLVVLGPTSH MAWLSGADPH GDERPVMLLV SQSHAGFLMP 
ALNANSVRQA TDLPFEPWTD EAGPTDALGR LLEVCNISGP GKTVALDEAM RADFALLLLD 
AMEAPVRRFS GDTLGHLRAM KDTAEVEALR TCAHLNDAAA SAGFASLRAG MTERDVATII 
RDHYVAHGAK PEFTIVAFGA NGAFPHHHTG DTVLHDDMAV LIDTGCRIGG YPSDMTRCGW 
FGSAPSAEFL RVADVVERAV QAAIAVVCPG VLAREIDAAA RGVIEDAGYG DFFVHRTGHG 
LGLDIHEPPY ITATSDTLMQ AGHVFSIEPG IYLPGQFGLR LEDIVIATDT GADVLSALPR 
TIVTSVDGPA S