Gene Noca_3820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3820
Symbol
ID	4595885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4040538
End bp	4041734
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	73%
IMG OID	639778428
Product	type I phosphodiesterase/nucleotide pyrophosphatase
Protein accession	YP_925007
Protein GI	119718042
COG category	[R] General function prediction only
COG ID	[COG1524] Uncharacterized proteins of the AP superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.965003
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGGTCG TCGACGGCTG CCGGCCCGAC GAGATCGACA GCGGCCTGAC GCCGAACCTG 
GCGGCGCTGC GCGACGGTGG GCTCCGGTTC CCGCAGGCGT CGTCGATGCC GGTCATGGAG 
ACGATCCCCA ACCACGTGAT GATGATGACC GGGCTGCGCC CCGACCGCAC CGGGGTGCCC 
GCGAACTCCG TCTTCGACCG CGGGCTCGGC GAGGTGCGCA CCCTCGACCG GCCCTCGGAC 
ATCCGGTGCG GAACGCTGCT GGGCCGGCTC GGCCGGCGCG GCCTCACCAC CGGCACGGTG 
CTCTCCAAGA CCTACCTGTA CGGCGTCTTC GGCGGCCGTC CCACACACCG CTGGGAGCCC 
AGCCCGACGC TGCCGATCAC CGACCACGCC CCCGACGCGC TCACCATCGA CGCCGCGATC 
ACGATGCTCG AGGAGTACGA CCCGAACCTG ATGTTCGTCA ACCTCGGCGA CATCGACCGG 
TTCGGGCACG CCGACCTCAC CGGCACCACG CTGCGCGTCG CCCGCCGGCT CGCACTGGCC 
GACACCGACC TGCAGGTCCA GCGGTTCCTC GACGCGCTGA AGGCCCAGGG GCTCTGGGAC 
CGGTCGATCG TGATCGTGCT GGCGGACCAC TCGATGGACT GGTCGACCCC GGACCGGTTG 
ATCGGCCTGA CCGGGCCGCT CACCGCAGAC CCGCTGCTCG CCGGGCGGGT CCAGATCGCC 
GACAACGGCG GCGCCGACCT CCTGTACTGG ACCGGCCCCG ATACCCAGCG CGCCGAGGCG 
ATCGAACGGA TGCGGACCAT CGCGCGGGCC CAGGAGGGGG TGCTCGCGGC GTACGCACGC 
ACCGCCCCCT GGCTGCGCCT GGGACCGGAG GCCGGTGACG TCGTAGTGTT CTGCCAGGCC 
GGCTGGCGGT TCAGCGAGCC GGACCCCACC GCGAACCCGA TCCCCGGCAA CCACGGCCAC 
CCGGCCACCC GGTCGATCCC GTTCTTCGTC GGCGGCGGCC ACCCCGACGT ACCCCGACGC 
ACCGCGTCCT CGCGGGTCGC CCGCACCATC GACGTCGCCC CCACCGTCGC CGCGTTCTTC 
GGCGCCGGCG CGCCGAAGGG CGGGTACGAC GGCCGCAACC TGCTCCCCCG CACCCCACGA 
CAGCAACCGG TGATCGAGAT CGTGGAGGTC CCCGCACCCC ACGCCGGCCA CCGGTGA

Protein sequence

MLVVDGCRPD EIDSGLTPNL AALRDGGLRF PQASSMPVME TIPNHVMMMT GLRPDRTGVP 
ANSVFDRGLG EVRTLDRPSD IRCGTLLGRL GRRGLTTGTV LSKTYLYGVF GGRPTHRWEP 
SPTLPITDHA PDALTIDAAI TMLEEYDPNL MFVNLGDIDR FGHADLTGTT LRVARRLALA 
DTDLQVQRFL DALKAQGLWD RSIVIVLADH SMDWSTPDRL IGLTGPLTAD PLLAGRVQIA 
DNGGADLLYW TGPDTQRAEA IERMRTIARA QEGVLAAYAR TAPWLRLGPE AGDVVVFCQA 
GWRFSEPDPT ANPIPGNHGH PATRSIPFFV GGGHPDVPRR TASSRVARTI DVAPTVAAFF 
GAGAPKGGYD GRNLLPRTPR QQPVIEIVEV PAPHAGHR