Gene Noca_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2021
Symbol
ID	4598643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2165981
End bp	2167549
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	75%
IMG OID	639776625
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_923218
Protein GI	119716253
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1178] ABC-type Fe3+ transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0398286
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCAGCTGC CGCTGCCCGG GACGGAGCCG GCAGCCCGCA CGCACCCGCA GCGTCCCGAG 
CCCGCTCCGC CATTCCTCCT GGCGCTGGGC GCGCTGGTCA CCGTCGCCTG CCTGATCCCG 
CTCGGGTACG TCGTGTGGTC GGTCGCCGAC GTCGGCCTGG CCGAGGCCCG CGACTACCTG 
TTCCGGCCCC GGATCGGCGA GCTGCTGTGG AACACCTCCC GGCTGCTGGT CGGCGGCGTG 
GCCCTCAGCG TCGTGCTCGG CGTCGGGGGT GCCTGGCTGG TCGAGCGCAC CGACGTCCCC 
GGCCGGGGCT GGTGGCACGG CTTGATGTGC GCGCCGCTCG CCGTACCCGC CTTCGTCAAC 
GGCTACGGCT GGGTCTCGAT GACGCACGCG GTGCAGAGCT ACGGCGGCGC CGCGCTCGTC 
GTCAGCCTGT CGTACTTCCC GTTCGTCTAC CTGCCCACCG TCGCGGCCCT GCGCCGCCTC 
GACCCGAGCC TGGAGGAGGT CAGCGCCTCC CTGGGACAGC GGCCGCTCGC GACGTTCCTG 
CGGGTGGTGC TGCCCGCGAT CAGCCCCGCC GTGCTCGGCG GCGCGCTGCT GGTCGGCCTG 
CACCTGCTGG CGGAGTACGG CGCCCTGCAG CTGCTCAACT ACCCCACCCT GACCACGGCG 
ATCCTGCAGC AGTACGGCAC CTCCTTCAAC GGCCCGGCCG CCAGCCTGCT CGCGCTCGTC 
CTCGTCGTGT TCTGCCTGGC GCTGCTGGCC GTCGAGCTGC TGCTGCGTGG CCGCGGCCGC 
CGGGCCCGGG TCGGCTCGGG CGCCGCCCGC GCCGCCGACC CGCACCGCCT CGGCCGCGGG 
CGGCTCCCGG CGGCGGGTGG GCTCGCCGCG CTCGTCGTAC TCGCCCTCGG CGTGCCGCTG 
CTCAACCTGG CCCGGTGGCT GGTGCGCGGC TCCTCGACCC GGTGGGACCT GCCCGACCTG 
ACCTCGGCCA TCGCGACCTC CGTCGGCCTC GCCGTGCTCG CCGGTCTGGT CGCCACGGCC 
GCGGCGACAC CGGTCGCGTG GCTCTCGGTG CGGCACCGCG GCGGGCTGAC CACGACGCTG 
GAGCGGGCCA CCTACACCGC CAGCGCGATG CCCGGCATCG TGGTCGCGCT CGCCCTGGTC 
ACGGTGTCGA TCCGTGCCGT CCCCGCGCTC TACCAGACCG TGCCGCTGCT GGTGATCGGC 
TACGTCATCC TGTTCCTGCC GCGCGCGGTC GTGAGCCTCC GGCCGACCAT GGAGCTCGCG 
CCGCCGGTGC TCGAGGACGT GGCGCGCTCG CTGGGCTGCG GCCGCACCGG CGTCGGCCTC 
CGGGTGACCG CGCCACTCAT CGCGCCCGGC CTCGCGGCCG GCTTCGCGCT CGTGTCCCTG 
GCCGTGTCGA CCGAGCTGAC CGCCACTCTG CTGCTCGCCC CGATCGGCAC CGACACGCTC 
TCCACGGAGT TCTGGTCCAA GGCCTCCTCC GTCGCGTACG GCGCGGCCGC GCCGTACGCC 
CTGGCGCTCG TGGTGCTCTC GGTCCCGGCG ACCTGGCTGC TCAGCCGAGT CACGGTGGGT 
GCGCGATGA

Protein sequence

MQLPLPGTEP AARTHPQRPE PAPPFLLALG ALVTVACLIP LGYVVWSVAD VGLAEARDYL 
FRPRIGELLW NTSRLLVGGV ALSVVLGVGG AWLVERTDVP GRGWWHGLMC APLAVPAFVN 
GYGWVSMTHA VQSYGGAALV VSLSYFPFVY LPTVAALRRL DPSLEEVSAS LGQRPLATFL 
RVVLPAISPA VLGGALLVGL HLLAEYGALQ LLNYPTLTTA ILQQYGTSFN GPAASLLALV 
LVVFCLALLA VELLLRGRGR RARVGSGAAR AADPHRLGRG RLPAAGGLAA LVVLALGVPL 
LNLARWLVRG SSTRWDLPDL TSAIATSVGL AVLAGLVATA AATPVAWLSV RHRGGLTTTL 
ERATYTASAM PGIVVALALV TVSIRAVPAL YQTVPLLVIG YVILFLPRAV VSLRPTMELA 
PPVLEDVARS LGCGRTGVGL RVTAPLIAPG LAAGFALVSL AVSTELTATL LLAPIGTDTL 
STEFWSKASS VAYGAAAPYA LALVVLSVPA TWLLSRVTVG AR