Gene Noca_2241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2241
Symbol
ID	4598739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	2387334
End bp	2389304
Gene Length	1971 bp
Protein Length	656 aa
Translation table	11
GC content	73%
IMG OID	639776840
Product	hypothetical protein
Protein accession	YP_923433
Protein GI	119716468
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCACCG TCATCACCGC CGTGCGCCGG GCGAGCCGAC TCGGCATCGC GGCCCTGGCG 
CTCCTGGTGC TCACCACGCT CCTCGGAGCT GCCTCGACCC TCCAGCCTCC CGCCGCAGCG 
GCCAGCGAGC CGGCCGCCAG CACGGCGCAC CTCGCTCCAG TCGCCCCGGC GGCGACCAGC 
GGCACTCAGC CGACCCGCAA CCTCAAGATG GGCTGCCCGG GGCCCGACGC CCTATGCGAC 
CTCGGCAGCG ACGCCGTCGA CTGCGCCAAG GACCCGATCG ATTGCGGCAA GGACGCCGCC 
GGCGATGTGA AGGACGGTGC CGGCGACCTG CTCGACGGCG CAGGAGATCT GCTCCCCGAC 
GGCTGCGGGA TCCTCGACGC GATCTGCGGC AACATCGGCG GACTGCCCGG GCTTTCGGGC 
GTCCCTGGGC TGCCCGGGAT CCCCGGTCTG CCGAACGTCG GTGACCTCTT CGGCGGCGGC 
ATCCCCGGGC TGGGCGACAT CCCCAACCCG TTCGAGGCCA TCGGCGACGT CATCGCCAAG 
GCCGCGGCCG ACGCCTGGAC CGCGGCCATG CTCGCGATCT GGAACTCCGG CCTGTTCGTG 
CTGCGCATCG TGCTCACGTT CAGTGAGCTG TTCTTGACTC CGGACCTGAG CGCCGACGGC 
CCGGGCAAGG ACGTCTACGC CTTCACCCTG TGGCTGGCGC TGGCCCTGGT GGTCATCTTG 
GCGATGATCC AGCTCGGCGC CGCCGCCTTC AAGCGCGAGG GCAAGAGCCT CGCCCGGGCC 
TTCATCGGGT CCGGCCAGTT CGTCTTGGTG TGCGCCAGCT GGTTCGGGTA CTGCGTCATG 
ATCATCGCGG CCTGCGGGGC GCTGACCAAG GCGCTGATGA AGTCGCTGCT CAAGGTGCAG 
ACCTGGCCCG ACTGGGACCC GCTCGGCGGA CTCGGCATCG ACGACATCAC CGACGCCGGC 
GTGGCCACCG CGCTGGCATT CCTCGGGATC TTCCTGTGGC TGGCCGCCAT CGGGCACGTC 
CTGGTCTACC TGGCCCGCGC GGCGTCCCTG CTGGTGCTCA CCGCCACGGG GCCGCTCGCG 
GCCGCCGGCC TGGTCTCGGA GTTCACCCGC TCCTGGTTCT GGAAGTCGCT GCGCTGGTTC 
CACGCCGCGG CGTTCACCCC GGTGCTGATG GTGATGGTGC TGGGCATCGG CGTGCAGTTC 
GCCAACGGAG TCGCCGCCCA CCTAGCCGAG GACACCGCCA AGGCGTTCGG CACCGCGCTG 
CCGGCCGTGA TGACGATCCT GATCAGCGTC GTCGCCCCGC TGTCCCTGTT CAAGCTCCTT 
GCCTTCGTCG ACCCCGGCAC CCCCAGCGGC GCGTCCTTTC GCCAGGGCAT GGCCATCCAG 
GGCGGCCTCC AGGGCCTGCT CAGCGGCGGC GGCGCGGGCG GAGGCTCGTC GGCTGCGTCG 
ACCACCGACG CCAACGGCCG CTCCTCGGGC GAGCAGAGTG CCGAGGCCTC GACCGGCGAC 
CGGTTCAGCA AATCGACCCA GGGCGCCCTG GGCAGCTTCG GCCCGGTGGG CCAGGCCCTG 
TCGACCGGCA TGGGCTGGAT CAACTCCGCC GGCGCGAAGG CGACCTCGCT GATGTCGGAC 
GAAACCAACC AGGCCGGTGT CGGCCAGAGC ACCTACGGCC CCGACTTCAG CGGCCTGAGT 
GGACGGCAGT CCGGTGGCCA GTCCGGCGGC CAGGGCGGGA CCCACCCCGG GTCGCAGAAC 
GGCGACCAGA GCGACGGGGA TTCGTCGATG CCGACCCCGC CCACGCCTCC TGCGCCGCCC 
ACCCCGCCGA CGCTGCCCAC TGGCGGCGGA CCCGGCGGCG GTTCAGGTGG CCAGGGCGGC 
AGGGGAGCTG ACGCAGCTCC CAAGACCCCG GCCGCCGGCG GCGGGGGAGC AGCAGGAGGT 
GCCGGCGGCG CCGGCGCGGC CGCTGGCGGC ATTCCACCGG TGGCGGGGTA A

Protein sequence

MSTVITAVRR ASRLGIAALA LLVLTTLLGA ASTLQPPAAA ASEPAASTAH LAPVAPAATS 
GTQPTRNLKM GCPGPDALCD LGSDAVDCAK DPIDCGKDAA GDVKDGAGDL LDGAGDLLPD 
GCGILDAICG NIGGLPGLSG VPGLPGIPGL PNVGDLFGGG IPGLGDIPNP FEAIGDVIAK 
AAADAWTAAM LAIWNSGLFV LRIVLTFSEL FLTPDLSADG PGKDVYAFTL WLALALVVIL 
AMIQLGAAAF KREGKSLARA FIGSGQFVLV CASWFGYCVM IIAACGALTK ALMKSLLKVQ 
TWPDWDPLGG LGIDDITDAG VATALAFLGI FLWLAAIGHV LVYLARAASL LVLTATGPLA 
AAGLVSEFTR SWFWKSLRWF HAAAFTPVLM VMVLGIGVQF ANGVAAHLAE DTAKAFGTAL 
PAVMTILISV VAPLSLFKLL AFVDPGTPSG ASFRQGMAIQ GGLQGLLSGG GAGGGSSAAS 
TTDANGRSSG EQSAEASTGD RFSKSTQGAL GSFGPVGQAL STGMGWINSA GAKATSLMSD 
ETNQAGVGQS TYGPDFSGLS GRQSGGQSGG QGGTHPGSQN GDQSDGDSSM PTPPTPPAPP 
TPPTLPTGGG PGGGSGGQGG RGADAAPKTP AAGGGGAAGG AGGAGAAAGG IPPVAG