Gene Ndas_1498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1498
Symbol
ID	9245348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1836568
End bp	1837671
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	72%
IMG OID
Product	peptidylprolyl isomerase FKBP-type
Protein accession	YP_003679434
Protein GI	297560460
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.169435
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000876054
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCACCGAC GTGCTGCCGC CCTCGCGGTG CCGCTGACCG CGATCGCCCT GGCGGTCTCA 
AGCTGCGGAA ACATCCCCGA AGAGTGGCGT ACTCCCGCCT TCATGCGTAT GGGGGAGGAC 
CAGCTCGACC CGCGGCTTCC CGAAGTCACC GGCGAGGTCG GTGAGGAACC GGAGGTCGCC 
TTCCCCGACG AGGAGCCCCC CACCGAGCAG ATCGCGGGCG TCGTCGACGA GGGCCCGGGC 
GAGAACGAGC TGGTGCGCGC CGACGACCTC CTGATCGCCA ACGTCGTCCA GTTCCAGTGG 
ACCGGCCCCG GCGAGGGCGC GCCCGTCGAG GGGCAGTCCA GCTACGAGAC CGGCGCCCCG 
GACCTGATCC GCATGGAGCA GATGCCCGCG GAGATCAGCG ACGTGCTGGT CAGCCAGCCG 
GTCGGCAGCC GGGCCGTGTA CGTCTTCCCG CCCCTGACCG AGCAGGAGCG CCAGCAGGCC 
GAGATGTCGG GACAGCCCGT CCAGGAGGGC GCGAGCGTCC TGGTCATCGA CCTGATGGAC 
CGCTTCAACA AGGGTTCGGT CGTGGAGGGC CAGCAGGTCA CCGACGGCGG CGACGGCCTG 
CCCACGGTGA CCCAGGAGGG CCACAGCGAG CCCACCATCG AGGTCCCCGA CACCGATCCC 
CCCGAGAACC TGGAGGTCGT CCCGCTCATC GAGGGCGACG GCGCCGAGGT CGAGGAGGGC 
CAGCAGGTCA TCGTCCAGTA CAGCGGTGTG CGCTGGGAGG CCGACGACAA CGGCGAACAC 
CCGGTGTTCG ACTCCACCTG GAGCCGCGGC GGCGACCCCT TCGACACCAC GATCGGCGCG 
GGCGCGGTCA TCGAGGGCTG GGACGAGGGC ATCGTCGGCC AGCCGGTCGG CAGCCGCCTG 
ATGCTGGTCG TGCCCGGCGA CATGGCCTAC GGCGAGACCG AGGAGGAGTC CGGGGGAGCC 
CCCGCCGGGA CGCTGGTCTT CGTCATCGAC ATCCTGGGCG CCTACGACAA CCCCCCGGCC 
CCCGAGCCCG CAGAGGGCGA GGGCGCCGGC GGCGAGGAGG CCGCACCGGA GGAGTCCCCC 
GCGCCCGAGG AGGGCGGGGA GTAG

Protein sequence

MHRRAAALAV PLTAIALAVS SCGNIPEEWR TPAFMRMGED QLDPRLPEVT GEVGEEPEVA 
FPDEEPPTEQ IAGVVDEGPG ENELVRADDL LIANVVQFQW TGPGEGAPVE GQSSYETGAP 
DLIRMEQMPA EISDVLVSQP VGSRAVYVFP PLTEQERQQA EMSGQPVQEG ASVLVIDLMD 
RFNKGSVVEG QQVTDGGDGL PTVTQEGHSE PTIEVPDTDP PENLEVVPLI EGDGAEVEEG 
QQVIVQYSGV RWEADDNGEH PVFDSTWSRG GDPFDTTIGA GAVIEGWDEG IVGQPVGSRL 
MLVVPGDMAY GETEEESGGA PAGTLVFVID ILGAYDNPPA PEPAEGEGAG GEEAAPEESP 
APEEGGE