Gene Noca_2040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2040
Symbol
ID	4598663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2183254
End bp	2184510
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	73%
IMG OID	639776643
Product	hypothetical protein
Protein accession	YP_923236
Protein GI	119716271
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.923068
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGACACCC AGACCCTGAT CAACCTCGCC CTGGTCCTGT TGTTCATCCT GGTCGGCGGG 
GTGTTCGCCG GCACCGAGAT CGCGCTGGTC TCGCTGCGCG AGGGCCAGAT CAACACGCTC 
GCCTCGCGCG GCGCGCGCGG CGCCAGGGTG GCCTCCGTGG CCCGCGACCC GAACCGGTTC 
CTCGCCGCGG TCCAGATCGG CGTCACGCTG GCCGGCTTCT TCTCCGCGGC GTACGGCGCC 
TCCACCCTCG CGCCCGACTT CGCGCCGGTG CTCGAGCACG CCGGGCTCGG CGCGGACGCG 
GCCGACACCG CCGCGCTGGT GCTGCTGACA CTGTTCATCG CCTACCTCTC CCTGGTGTTC 
AGCGAGCTGG TCCCCAAGCG GCTCGCCCTC CAGCGCGCGG CCGGCGTGTC CTACCTCGTC 
GGCGCGCCGC TGGACCGGTT CGCGACCCTC ATGCGCCCGG TGGTGTGGCT GCTCTCGGTC 
TCCACCAACG CGGTGGTCCG CCTCTTCGGC GGCGACCCCG GCGCGGCCGC CGAGGATCTC 
AGCGACGAGG AGCTGCGCTA CCTGGTCGAC CAGCACGAGG GCCTCGCCGA GGACGAGCGG 
CGGATCCTCG CCGACGTCTT CGACGCCGGC GACCGGTCCC TGAGCGAGGT GATGCGGCCC 
CGCGGCGACG TGACGTTCCT GGCCGGCGAC GCCACGGTCG CCGACGCGAT CGCCATCGCG 
CTGACCAGCC CGTACTCCCG CTACCCCGTC ACCGGCACCG GCCACGACGA CATCCGCGGC 
TTCCTGCACG TGCGCGACCT GCTGGGCGCC GACCCCCGCA AGCGGGTGCG CTCGATCACC 
CGCAAGATCC TGCACCTGCC CGCCACCAAC CGGGTGCTCC CCTCGCTCTC CCGGATGCGG 
GCCGAGGGCA GCCACATCGC CGTCGTCGTC GACGAGTACG GCGGCACCGA CGGCATCGTC 
ACCCTCGAGG ACCTGGTCGA GGAGCTGGTC GGCGACATCC ACGACGAGTA CGACGAGCGG 
GCGAGCGTGG CGGCCGGCGA GGTGGACGCG GGGCTGACCA TCGAGGAGTT CGGCGAGCGC 
ACCGGCGTCG AGCTCGAGGA CGGCCCCTAC GAGACCGCCG CCGGGTACGT CGTGCACCGG 
CTCGGCCGGC TCGCCGTGGC CGGGGACGTG GTGGCCGTGG GCGAGCACGA GATCGAGGTC 
GCGACCGTCG ACAAGCACCG GATCACCCGG CTGCGGGTGC GCCCGCGCGA GTCCTGA

Protein sequence

MDTQTLINLA LVLLFILVGG VFAGTEIALV SLREGQINTL ASRGARGARV ASVARDPNRF 
LAAVQIGVTL AGFFSAAYGA STLAPDFAPV LEHAGLGADA ADTAALVLLT LFIAYLSLVF 
SELVPKRLAL QRAAGVSYLV GAPLDRFATL MRPVVWLLSV STNAVVRLFG GDPGAAAEDL 
SDEELRYLVD QHEGLAEDER RILADVFDAG DRSLSEVMRP RGDVTFLAGD ATVADAIAIA 
LTSPYSRYPV TGTGHDDIRG FLHVRDLLGA DPRKRVRSIT RKILHLPATN RVLPSLSRMR 
AEGSHIAVVV DEYGGTDGIV TLEDLVEELV GDIHDEYDER ASVAAGEVDA GLTIEEFGER 
TGVELEDGPY ETAAGYVVHR LGRLAVAGDV VAVGEHEIEV ATVDKHRITR LRVRPRES