Gene Noca_4371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4371
Symbol
ID	4596889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4620780
End bp	4621931
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	70%
IMG OID	639778981
Product	hypothetical protein
Protein accession	YP_925555
Protein GI	119718590
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGACC TGACCCGTCC TCTCCAGGAC GCGATCGCCG AGGCGGAGAA GCTGATCGAG 
AGCGCGCCGT TCATCCGCAC CGAGCAGGAC CTGCTGGAGG GCTACGACTA CCTCTCCGGG 
CGGATCCGGA TGGCGCTGCA GATGGCCTTC GACCACGACC TCGCGCGGCC GCTGTTCATC 
AACCCCACCC ACCAGTTCTC CCGCCAGGGC CTGGACAACC CCGATGCCAT CTACTTCAAC 
GCCTACCTCG AGGAGGGCGT CGAGTACGTC GTGCGCGGCG TGCGCGGCAG CACCGCCGAC 
CTGTCCTTCC AGGTGATGGG CGGGGCCTAC ACCGCCGACT CGGCGGCCAC GTCGATGCTC 
GCGTTCGACG ACCGCGAGCT CGACCTCGCC GAGGACGGCT CGTTCGAGTT CAGCTACGTC 
GCCGAGCCGG GCGCGAAGAC GATGATCGTG CGCGAGGTCT TCAACGACTG GGACACCGAG 
GAGCGCGGCC GGATCTGGAT CGAGCGCACC GACACCCTCG GGCTCCCGGC CGCGCCGCTC 
ACCCGGGCGC GGCTGGAGCG GAAGTACGAG GTCGCCGCCA AGCTGCTGAC CGGGTCCATC 
CGGACCTGGC TGGCGTTCCC CCAGTTCTTC GAGCGCCAGG AGCCCGCCAA CCAGCCGACC 
CCGCCGAGGT CGACGCCCGG CGGTCTGTCG TCGCAGCGCT CGTCGATCGG CCACTACGAG 
CTCGACGACG ACCAGGCGCT GATCATCACC GTCCCCGAGT GCACCGACTG CGCCTACCAG 
GCGATCCAGA TCGGCTCGGA CTGGTACGTC TCCACCGACT ACGAGACCCA CCAGACCTCG 
CTGACCAAGG CCCAGGCCGT GGTGGATCCC GACGGCCTGA TGCGGTTCGT CATCTCCGAG 
CGCTCCCCCG CCGGTCCCGA CGCGCGGCTC GCCAACTGGC TCGAGTGCAC CGGCCACCGG 
ACCGGGTCGC TGATGCTGCG CTGGCAGCGC CTCGAGCGCG ACCTCGGCCC CGCGGACGGC 
CCCGTCGCCG AGGTCGTCGC GCTCGCCGAC GTACCGGACA GGCTGCCCCA CTTCACCCCG 
ATCACCACCG AGCAGTACGC CGAGCGGATC GCCGCCCGGC AGCGCTCCGT CGCCCGAAGG 
ATGCTGAGCT GA

Protein sequence

MGDLTRPLQD AIAEAEKLIE SAPFIRTEQD LLEGYDYLSG RIRMALQMAF DHDLARPLFI 
NPTHQFSRQG LDNPDAIYFN AYLEEGVEYV VRGVRGSTAD LSFQVMGGAY TADSAATSML 
AFDDRELDLA EDGSFEFSYV AEPGAKTMIV REVFNDWDTE ERGRIWIERT DTLGLPAAPL 
TRARLERKYE VAAKLLTGSI RTWLAFPQFF ERQEPANQPT PPRSTPGGLS SQRSSIGHYE 
LDDDQALIIT VPECTDCAYQ AIQIGSDWYV STDYETHQTS LTKAQAVVDP DGLMRFVISE 
RSPAGPDARL ANWLECTGHR TGSLMLRWQR LERDLGPADG PVAEVVALAD VPDRLPHFTP 
ITTEQYAERI AARQRSVARR MLS