Gene Noca_2821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2821
Symbol
ID	4596111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2990635
End bp	2991849
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	72%
IMG OID	639777426
Product	virulence factor Mce family protein
Protein accession	YP_924010
Protein GI	119717045
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID	[TIGR00996] virulence factor Mce family protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.383501
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCACCG GGTTGTGGAG CCGGGTCAAC GGCCGCGCGC TCGCGGTCGC GGCCGCTGTC 
GTGCTGCTGG CGGCGACGTA CTTCATCGTG CTGCGCGACG ACACCGCGAC CAAGACCGTG 
AGCGCCCACT TCCCGCGGGC GGTCAGCATC TACGAGGGCA GCGACGTGCG GATCCTCGGC 
GTGAACGTCG GCCGGGTGAC CGCGGTGACG CCGGAGGGCA ACTCCGTGCG CGTGGACATG 
GAGTACGACG CGGAGTACCA GGTGCCGGCC GACGCCCAGG CCGTGATCGT GACTCCGACC 
CTGGTCGCGG ACCGGTTCGT CCAGCTCACG CCGGCCTACG CCGAGGGCGA CCGGGTGCTG 
GCCGACGGCG CGGACATCGC GCTGCCCGAC ACCGGTGTCC CGGTCGAGCT GGACCGGATC 
TACGCGAGCC TGCGCGACCT CTCCGAGGCC CTCGGCCCCA ACGGCGTCAA CAAGGACGGC 
ACCCTCGACC ATCTGCTCGA GGCCGGGGCG CACGCGTTGG ACGGCAGGGG CGCGCTCGGC 
AACCGGATGC TCACCCGGCT CGCCGCGGCC GCGCGGACGT TCGGCGAGGG AGCGGGTCCG 
CTGTTCGACA CCGTCAGCCG GCTCGCCGAG TTCACCACCA CGCTCGCGGA GAACGGCAAG 
TTCGTCCGGG CGTTCATCAA GGACCTCGCC GGCGTCTCGT CCCAGCTCGC GGACGAGCGA 
ACCGAGATCC AGGGAGCGCT CGCGGCGGTC GCGGACGCGG TCGGGACCGT GAAGTCGTTC 
GTGCACGACA ACCGTGCGGC GCTGGTCGCG GACGTCGAGC GACTCACCCG GGTGATGAAG 
ACCATCGCCT CCGAGAAGGA CAGCATCGAC ACCGCGCTGC GCGTCGCGCC CGTAGCCATC 
GGCAACCTCA GCCTGGCCTA CAACAGCAGG TCCGGGACGA TCGGCTCCCG CATCGGCATC 
AGCGGCAACG TGTGGGACGC CGACGGCTTC CTGTGCGCCG TGGTCCAGCA GTCCAGCCTC 
TCGCGGGCCA GCAAGGACCT GGCGTGCACG CTGTTCAAGC AGCTTCTCGA GCCGGTCGAG 
GGCCAGGTGC CGACCATCCC GCCCGGGCCC GACGGCCGGT CGTCGACGGG CGATCAGGTG 
CCGCGCCAGG TGCAGCGTCA GTACGCCGGA GCCGGCGGCG GGTCGCTCGG CCAGCTGATG 
GGGGGCGGCT CGTGA

Protein sequence

MITGLWSRVN GRALAVAAAV VLLAATYFIV LRDDTATKTV SAHFPRAVSI YEGSDVRILG 
VNVGRVTAVT PEGNSVRVDM EYDAEYQVPA DAQAVIVTPT LVADRFVQLT PAYAEGDRVL 
ADGADIALPD TGVPVELDRI YASLRDLSEA LGPNGVNKDG TLDHLLEAGA HALDGRGALG 
NRMLTRLAAA ARTFGEGAGP LFDTVSRLAE FTTTLAENGK FVRAFIKDLA GVSSQLADER 
TEIQGALAAV ADAVGTVKSF VHDNRAALVA DVERLTRVMK TIASEKDSID TALRVAPVAI 
GNLSLAYNSR SGTIGSRIGI SGNVWDADGF LCAVVQQSSL SRASKDLACT LFKQLLEPVE 
GQVPTIPPGP DGRSSTGDQV PRQVQRQYAG AGGGSLGQLM GGGS