Gene Arth_4355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4355
Symbol
ID	4443466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008538
Strand	+
Start bp	94908
End bp	95912
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	58%
IMG OID	639687676
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems periplasmic components
Protein accession	YP_829373
Protein GI	116662319
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0000418029
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTTG AACCAATGGG ACGCCGCGGA TTTATCAAGA TCACAGCGGC AGCGGGCGGG 
ACGTTATTTC TGGGAGGCCT CACGGCGTGC GGCCAGGACA GCGGCGGCAG CGGCGGGGGT 
AAGAAGGGAT ATTCCGGCGA CGTTGCTATT ACTGGTCTGG CCAGTCTTAT TCATTCCGCC 
CCCTTCTTTA TCGCCCAGAC GGAAGGCTAC TACGAGGAAG AGGGGCTGAC CCTTGAGCAT 
ATTCAGTTCC CAGGGGGGCT TGACACTGTT CGAGGAATCG AATCCGGCAT AGGTTTCGGT 
ACGTCGTCCA CTATTCCCGT CTTTATCGCG GCCGAGAAGG GCATGGACGT AAAAATCTTC 
GGCAATGTTT ATACGGCGGC TTCTGTCGAC TTCATTGCGC TGCCCGACTC TCCCGTCACC 
TCCATTGAGG ATGTCAGGGG CAAGAAAGTG GCAGTCAGCA CGCCAGGATC AAACTCCTCG 
TATTTCGCAG ACCGCACGCT GCGGGCCGCT GGCTTAGTCC CAGGCAAGGA CGTTGAACTT 
ATCAGCGTCG GCTCAGCGAG CGATTCGTGG ACCGCCGTCT CCCAGAAAGT TGTTGACGTA 
GCGTGGACGG CTTCGCCGCT TTCCGAGAAA ATCGCCTCCG AAAGCGGAGC GAAGGTGATC 
TGGCGTTCCC GCGACTACGT AACGGACTGG TCGGACACCT GCCTCGTCGC GACAGGATCC 
TTCATCGACG AAAATACCGA GGCGTTGAAG GGCTGGGGCC GTGCGCTCAA GAAGGCGATG 
GACCTGATTA CCAACGACCT CGAAAAGGCC GCCGACGCCT ACGGGAAGGC AATCAAATAC 
GAGCCCAAGG TGGCTCTTGA GGCGCTGAAG AACTCGCAGA ACTTCTACAG CCTGGACTTC 
ACCGATGCCC AGCTGGCCGC CGTCGTCGCC GCCGGTAAAG AACAAGGCCA GATCACCAAA 
GAACCGGACA TGAACGCCAT CGTTATGAGG AACTTCCTTT CATGA

Protein sequence

MSFEPMGRRG FIKITAAAGG TLFLGGLTAC GQDSGGSGGG KKGYSGDVAI TGLASLIHSA 
PFFIAQTEGY YEEEGLTLEH IQFPGGLDTV RGIESGIGFG TSSTIPVFIA AEKGMDVKIF 
GNVYTAASVD FIALPDSPVT SIEDVRGKKV AVSTPGSNSS YFADRTLRAA GLVPGKDVEL 
ISVGSASDSW TAVSQKVVDV AWTASPLSEK IASESGAKVI WRSRDYVTDW SDTCLVATGS 
FIDENTEALK GWGRALKKAM DLITNDLEKA ADAYGKAIKY EPKVALEALK NSQNFYSLDF 
TDAQLAAVVA AGKEQGQITK EPDMNAIVMR NFLS