Gene Noca_3017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3017
Symbol
ID	4596464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3213538
End bp	3214818
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	68%
IMG OID	639777622
Product	extracellular ligand-binding receptor
Protein accession	YP_924206
Protein GI	119717241
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCGCT CCAGCCGCGC TCGCCGCGCA GCCATCACGC TCGCGGCATC CGCACTCGTC 
CTCACTGCTT GTGGCAGTGA CGGCGGCTCC GACAGCAAGT CCGACGCTCC CGACGAGGGC 
ACCTCCTCGT CGGCGCCGGC AACGACGGGT GACGGCGTGC TCAAGATCGG CCAGCTGCTG 
CCCCAGACCG GTGACCTCGC CTACCTGGGC CCCCCCGAGT TCGCGGGCGT CGACCTGGCC 
ATCAAGGAAA TCAACGACGC GGGTGGCGTG CTCGGGAAGC CCGTCGAGAG CTTCAAGGCG 
GACTCCGGCG ACGGTACGCC GGATATCGCG GGCGCCTCCG TCGACTCGCT CCTCCAGGAC 
AGCGTCGACG CCATCGTCGG TGCCGCCGCC TCCGGCGTGT CGCTCTCGGT GATCGACAAG 
ATCACCGGTG CCGGCGTCGT GCAGATCTCC CCGGCGAACA CCGCCGCGGC GTTCGACACC 
TACGACGACG GCGGCCTGTA CTTCCGCACC GCGCCGTCCG ACCGCCTGCA GGGCCAGGTG 
CTCGGCAACA TGGCGGTCGA GGACGGGTTC TCCAACGTCG CCGTGATGGC GCGCCAGGAT 
GCGTACGGCG AGGGTCTGGC CGAGCAGGTC GACCAGACGC TGAAGGAGCA GGGCGCCAAC 
GTCGCGGCCC ACATCCTCTA CGCCGCCGAC GCTCAGAACT TCACCGCAGA GGTCAACGAG 
ATCGCGGCGG CCAAGCCCGA CGCTCTCGTG CTGATCGCGT TCAACGAGAC GACGAAGATC 
ATCCCGCAGC TGATCGCCAA GGGGATCGGC CCGCAGGACA TCCAGCTCTA CTTCGTCGAC 
GGCAACATGG CCGACTACTC CGCCGAGTCC TTCGACCTGG AGGGCGTCAA GGGCACCTTC 
CCGGCTCCGG CCGAGGTCGA CGAGAGCTTC AACCAGCGGC TGCTCGAGGT GGACCCGAAG 
CTGAAGGACT TCACCTACGG CCCGCAGTCC TACGACGCCA CGATCCTCAC CGCGCTCGCT 
GCGATCGCGG CCGGGGACGA CTCCGGCGAG GCGATCGCCG GCGAGCTGGT CAACGTCTCC 
AAGGACGGCG AGGCCTGCAC CACGTTCGCC GACTGCGCGA AGCTGCTCGA GGACGGCCAG 
GACATCAACT ACGAGGGTGT CTCCGGCCCG ACCGACATGA ACGACACCGG CAGCCCGAAC 
GCTGCGACGA TCGGCATCCA GGAGTACGCC AAGAACAACA AGTACTCGCA GATCGACTCG 
GTCTCCGGCG TCCTGGAGTG A

Protein sequence

MIRSSRARRA AITLAASALV LTACGSDGGS DSKSDAPDEG TSSSAPATTG DGVLKIGQLL 
PQTGDLAYLG PPEFAGVDLA IKEINDAGGV LGKPVESFKA DSGDGTPDIA GASVDSLLQD 
SVDAIVGAAA SGVSLSVIDK ITGAGVVQIS PANTAAAFDT YDDGGLYFRT APSDRLQGQV 
LGNMAVEDGF SNVAVMARQD AYGEGLAEQV DQTLKEQGAN VAAHILYAAD AQNFTAEVNE 
IAAAKPDALV LIAFNETTKI IPQLIAKGIG PQDIQLYFVD GNMADYSAES FDLEGVKGTF 
PAPAEVDESF NQRLLEVDPK LKDFTYGPQS YDATILTALA AIAAGDDSGE AIAGELVNVS 
KDGEACTTFA DCAKLLEDGQ DINYEGVSGP TDMNDTGSPN AATIGIQEYA KNNKYSQIDS 
VSGVLE