Gene Noca_3854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3854
Symbol
ID	4597989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4072146
End bp	4073981
Gene Length	1836 bp
Protein Length	611 aa
Translation table	11
GC content	73%
IMG OID	639778460
Product	ABC transporter related
Protein accession	YP_925039
Protein GI	119718074
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.53962
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTAGCC CGGCGGCCAA CCTCGTCAAC CTCGAACGGG TCTCCAAGGC GTACGGCGTC 
CGGCCGCTGC TCACCGAGGT CTCGCTCGGC ATCGGCGCCG GCGAGCGGGT CGGCATCGTG 
GGCCGCAACG GTGACGGGAA GACCACCCTG CTCGAGGTGA TGACCGGCCT GGAGGAGCCC 
GACTCGGGCC GCGTCTCCCG CAGCCGGGGG CTGCAGGTCG GCTTCCTCCA CCAGGCCGAC 
CAGCTGGAGG ACACGCACAC CGTCCGGGAG GCGGTGCTGG CCGGCCGCTC CGACCACGAG 
TGGGCCGCGG ACCCGCGCAC CCGCGAGGTC GTCGAGGTGC TGCTGGCCGG CGTGGCGCTG 
GACCGCGCGG TCCTCGGCCT CTCCGGCGGG GAGCGCCGGC GCTGCTCGCT CGCGGCGCTG 
CTGCTCGGCG AGCACGACCT GGTGGTTCTC GACGAGCCCA CCAACCACCT GGACGTGGAG 
GCGGTCGCCT GGCTGGCGCA GCACCTGGTC CGCCGTACCT CCGCCCTGGT CGTGGTCACC 
CACGACCGCT GGTTCCTCGA CGAGGTCTGC CAGTGGACCT GGGAGGTGCA CGACGGCGTC 
GTCGACGCCT ACGAGGGCGG GTACGCCGCC TTCGTGCTGG CCAAGGCCGA GCGGCAGCGG 
CAGGCGGCCG CCTCGGAGGT GCGTCGGCAG AACCTGGTCC GCAAGGAGCT GGCCTGGCTG 
CGTCGCGGGC CGCCGGCGCG GACGTCGAAG CCGAAGTTCC GCATCGACGC CGCCAACCAG 
CTGATCGAGG ACGTGCCGCC GCCGCGGGAC CGGCTCGAGC TGCAGCGGTT CGCCACGCAG 
CGGCTCGGCA AGGACGTGAT CGACGTCGAG GACGTCGACC TGGCGCGCGG CGAGAAGCAG 
CTGCTCTCGC ACGCGACCTG GCGGCTCGGG CCCGGTGACC GGGTCGGCAT CGTCGGGGTG 
AACGGTGCCG GCAAGACCTC GGTGCTCTCG CTGCTGTCCG GCGAGCTCGC GCCGTCGGCC 
GGTCGCGTGC GGCTGGGCCG GACCGTCGCG CTGCAGCACC TGACCCAGCA GCTCGACGAC 
CTCGATCCCG AGGGCCGGGT GCTGCCGACC GTCGAGTCGA TCCGCCGGAT CACGAAGACC 
GCCGACGGGG AGATCACCGC GACCGCGATG CTGGAGCGCT TCGGCTTCAC CGGCGACCGG 
CTCACCGCCC GGATCGGGGA CCTCTCGGGT GGCGAGCGGC GGCGCTTCCA GCTGCTGCGG 
CTGCTGCTGT CCGAACCCAA CGTGCTGCTG CTCGACGAGC CCACCAACGA CCTGGACATC 
GAGACGCTCA ACGTGCTCGA GGACTTCTTG GACGGCTGGC CCGGCACGCT GGTGGTCGTC 
TCCCACGACC GGTACTTCCT CGAGCGGGTC ACCGACTCGG TCTGGGCGCT GCTCGGCGAC 
GGGCAGCTCT CGATGCTGCC CCGGGGCGTG GACGAGTACC TCGAGCGCCG CGCGGCCGAC 
CTCCACGTCG AGCCGGGACT TCTGGCCGCT GAGTCGGGAG TTCCGACGGT CGAGTCGGGA 
GTTGTGACCG GTGATGCGGG AGTTCCGGCC GCCGAGCCGA CGGTGAAGGC CAAGGCGGGG 
AGTGCCGAGG AGCGCGCGGC TCGCAAGACC ATCGCCCGCA TCGACAAGCG GCTCGAACGG 
ATCGCCGAGC AGGAGGCCGG GCTCAACGCC GAGATCCTCG AGCACGCCCA CGACTACGAG 
CGGCTCGCCG GGCTGAGTGC GCAGCTCGAC GGGCTCGCGG CGGAGAAGGA GAGCCTCGAG 
CTCGAGTGGC TCGAGGCCGC GGAGCTGCTG GAGTAG

Protein sequence

MPSPAANLVN LERVSKAYGV RPLLTEVSLG IGAGERVGIV GRNGDGKTTL LEVMTGLEEP 
DSGRVSRSRG LQVGFLHQAD QLEDTHTVRE AVLAGRSDHE WAADPRTREV VEVLLAGVAL 
DRAVLGLSGG ERRRCSLAAL LLGEHDLVVL DEPTNHLDVE AVAWLAQHLV RRTSALVVVT 
HDRWFLDEVC QWTWEVHDGV VDAYEGGYAA FVLAKAERQR QAAASEVRRQ NLVRKELAWL 
RRGPPARTSK PKFRIDAANQ LIEDVPPPRD RLELQRFATQ RLGKDVIDVE DVDLARGEKQ 
LLSHATWRLG PGDRVGIVGV NGAGKTSVLS LLSGELAPSA GRVRLGRTVA LQHLTQQLDD 
LDPEGRVLPT VESIRRITKT ADGEITATAM LERFGFTGDR LTARIGDLSG GERRRFQLLR 
LLLSEPNVLL LDEPTNDLDI ETLNVLEDFL DGWPGTLVVV SHDRYFLERV TDSVWALLGD 
GQLSMLPRGV DEYLERRAAD LHVEPGLLAA ESGVPTVESG VVTGDAGVPA AEPTVKAKAG 
SAEERAARKT IARIDKRLER IAEQEAGLNA EILEHAHDYE RLAGLSAQLD GLAAEKESLE 
LEWLEAAELL E