Gene Noca_1954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1954
Symbol
ID	4599860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	2085206
End bp	2086603
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	69%
IMG OID	639776553
Product	putative lipoprotein
Protein accession	YP_923151
Protein GI	119716186
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0503014
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCAAGC AGGAAGACCC TCACCACGTA CCACCACCCG ATCCTCGGGG CCGCGGTCGC 
GGCCCGCGAC GCTGGCTCGC CACCGTGGGC ATCCTCGCCC TCGGTGGGAT GGTGGCCCTG 
GCCTACCAGG CAACGGCGGG TCCGCCGGCG GCGAAGCCGG CGACCGTCCA GAACCCCCCG 
TCCGCCGGCG ACAACGCGCA GGCGATGGTC AAGGAGGGTC GACACACCTT CCGCTACGAC 
ACGTTCGGGG ACCAGGCGTT CTGGGGCGGC ACGCTCCAGC TCCACGACGC GATCGCGGGG 
GAGGACAACG GCGGCGTCGG TGGCGGCGTC AGCCCCAAGA CGGCGCTGGC CGTCGGGCTC 
AAGGTCGACG TCAAGCGGCT GCCCGCCAGC GTCAAGAACG CACTCGCGAA CGGCAAGGTG 
AACCTCGACG ACCCGGCGGT CACCCTGGCC CTGTTGAAGC TCAACTCGGT GGTCGGCGTG 
AGGGGGTTCT TCAACTCCGA CGGCACCCTG CGGACCGTCG GCATCGAGTG CGCGCTGTGC 
CACTCGACGG TCGACGACTC CTTCGCACCG GGCATCGGGA ACCGGCTCGA CGGCTGGGCC 
AACCGGGACC TGAACGTCGG GGCGATCGTG TCCCTCGCGC CGAACCTGCA GCCGATCGCC 
GATCTGCTGC ACACCGACGT CGACACGGTC AAGCAGGTCC TGGCCGCGTG GGGTCCGGGC 
CGGTTCGACG CGCAGCTGTT CCTCGACGGG AAGGCCTTCC GTCCGGACGG TACGACGGCG 
GCCACGGTGC TGCCGCCCGC GTTCGGGCTG CAGGGTGTCA ACCAGCACAC CTCGACCGGG 
TGGGGCTCGG TGACGTACTG GAACGCCTTC GTGGCGAACC TGGAGATGCA CGGTCAGGGC 
AACTTCTACG ACCCGCGTCT CGACAACGCC GACCAGTTCC CGATCGCGGC GGAGAACGGC 
TTCGGCCACG TGCGGTCGAA GGTCGACAAG ATCTCGTCGA AGCTGCCGGC GCTCGCCGCC 
TACCAGCTGT CGCTGACCGC GCCGACGCCG CCGAAGGGCA GCTTCGACCC GAAGGCGGCG 
GCCCGCGGTG AGTCGCTGTT CATGGGACAG GCCCAGTGCT CGACCTGCCA CGTCCCGCCG 
ACGTTCACCG AGCCGGGGTT CAACATGCAC ACCGGTGAGG AGATCGGGAT CGACAACTTC 
CAGGCCGATC GCTCGCCGAC GCACATGTAC CGCACCAGCC CGCTCAAGGG TCTGTGGAGC 
CACCAGAAGG GCGGCTTCTA CCACGATGGT CGGTTCCCGG AGCTGGTCGA CGTCGTCCAG 
CACTACAACG ACACCTTCGG CCTGGGCCTC ACCGAGGCCC AGCAGGGCGA CCTCGTCCAG 
TACCTGAAGT CGCTCTGA

Protein sequence

MVKQEDPHHV PPPDPRGRGR GPRRWLATVG ILALGGMVAL AYQATAGPPA AKPATVQNPP 
SAGDNAQAMV KEGRHTFRYD TFGDQAFWGG TLQLHDAIAG EDNGGVGGGV SPKTALAVGL 
KVDVKRLPAS VKNALANGKV NLDDPAVTLA LLKLNSVVGV RGFFNSDGTL RTVGIECALC 
HSTVDDSFAP GIGNRLDGWA NRDLNVGAIV SLAPNLQPIA DLLHTDVDTV KQVLAAWGPG 
RFDAQLFLDG KAFRPDGTTA ATVLPPAFGL QGVNQHTSTG WGSVTYWNAF VANLEMHGQG 
NFYDPRLDNA DQFPIAAENG FGHVRSKVDK ISSKLPALAA YQLSLTAPTP PKGSFDPKAA 
ARGESLFMGQ AQCSTCHVPP TFTEPGFNMH TGEEIGIDNF QADRSPTHMY RTSPLKGLWS 
HQKGGFYHDG RFPELVDVVQ HYNDTFGLGL TEAQQGDLVQ YLKSL