Gene Noca_1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1842
Symbol
ID	4597162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	1965841
End bp	1967025
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	65%
IMG OID	639776441
Product	extracellular ligand-binding receptor
Protein accession	YP_923040
Protein GI	119716075
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.843132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTCA AGAAGGCGTA CCTCGCGGCT GGCGCCACGC TGGCGTTGGC GCTCTTCGTC 
AGCGCGTGCG GCAGCGACTC GGGCGGGTCC GGCGGCGGTG GCGATGACAC GATCACCGTG 
GCGGTCGCGG GTCCCATGAC CGGAGACAAC GGCATCTACG GCCAGGATCA GCTGTCGGGC 
GTGCAGTTCG CAGCGAAGGA GATCAACGAC TCGGGCGGGA TCCCTGACGG TCCGTTGAAG 
GGCAAGAAGA TCAAGGTCGT CAAGTTCGAC GACGTGGCCG ACCCCAACCA GGGTGCGTCC 
GTGGCGCAGA AGATCTGTGA CGACACCAGC ATCATGGCGG TCTTCGGCCA CAGCAACTCC 
TCGGTCACGC TCGCCGCGGA GCCGATCTAC GAGCGCTGCG GGGTGCCGCT CTTCGTCAGC 
TACTCGTCGA ACCCGGAGAT CACCGCGGAG CTACACGAGA ACCTGTTCCG CACGCTCATC 
GACGACGCCA AGATGGGCAG CGAGATGGCG AGTTTTTCCC ACGACCAGCT CGGCTTCAAG 
AAGGTCGGCG TCATCGCCTC CGACGACGAC TACGGCGACG GCCTGAAGAC CAACTTCAAC 
AAGACGGCCG AGGAGATCGG CCTCGACGTC GCGAAGACCG TCACGACGTC GGCGAAGCAG 
AAGGACTTCA CGCCGCAGCT GACCGAGCTC CGCAACGCCG GTGCCGACTC GCTGGTGCTC 
CTGAACACCT ACACGGACGC CGCGCTGCAG ATCAAGCAGG CCGACGCGAT GGGCTGGGAC 
GTCCCGATCT TCGTCACCCC GGGCTCGAAC AGCCCGGAGC TGGTCAAGAT CGCCGGTGAG 
AAGGCGGCGG AGGGCACAAT CGTCGCCGCG GTCTTCGACC CCAACTCGAG CGAGCCGGGC 
CCGGCGAAGT TCGTCAACGA CTTCACCGCC GCCAACGGCA AGGGTCCGGG CGAGTCCGCC 
GCGATGTCCT ACGACTCCTT CTACGTGTTC CTGACCTCCC TGGAGAAGGG TGCGAAGGAC 
CGCAAGAGCG TCATCGAGAA GTCCGCCGAG ATCGGGACGT TCACACTCCC GATCCGCGGC 
GAGCTGATGT TCAACGAGAC CCACGAGCCG ACGGTCGTGC CGGGCAAGCC CGCGCAGATC 
CTGCTCCAGG TCAAGGACGG CCAGATCGGC AGCTACGCCG GCTGA

Protein sequence

MKFKKAYLAA GATLALALFV SACGSDSGGS GGGGDDTITV AVAGPMTGDN GIYGQDQLSG 
VQFAAKEIND SGGIPDGPLK GKKIKVVKFD DVADPNQGAS VAQKICDDTS IMAVFGHSNS 
SVTLAAEPIY ERCGVPLFVS YSSNPEITAE LHENLFRTLI DDAKMGSEMA SFSHDQLGFK 
KVGVIASDDD YGDGLKTNFN KTAEEIGLDV AKTVTTSAKQ KDFTPQLTEL RNAGADSLVL 
LNTYTDAALQ IKQADAMGWD VPIFVTPGSN SPELVKIAGE KAAEGTIVAA VFDPNSSEPG 
PAKFVNDFTA ANGKGPGESA AMSYDSFYVF LTSLEKGAKD RKSVIEKSAE IGTFTLPIRG 
ELMFNETHEP TVVPGKPAQI LLQVKDGQIG SYAG