Gene Arth_2268 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2268
Symbol
ID	4445311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2554647
End bp	2555747
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	66%
IMG OID	639690077
Product	hypothetical protein
Protein accession	YP_831748
Protein GI	116670815
COG category	[S] Function unknown
COG ID	[COG2339] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.37562
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCCGC CTGCCGCGGT GCGCAGCCGG TCAAGTGCGG GAGTTGTAGG ACTCGTGGGC 
GGCGGCGGCT TCCTGGCTTT TGCCAGCCTC TTCCTGGTCC TCCCCTACCT TGTTGGCAAC 
ACCGGCGTCA CCGGGTTCGT GATCGGCTTC ATCGCGTCCC TGATCCCGTT GAGCGCCGTG 
CTCCTCGCTG TCTACGTCAT TGACCGCTGG GAGCCCGAGC CCAAGCGCCT GTTGCTGTTC 
GCCTTTATGT GGGGCGCGGT CGTGTCTATT TCCGTCACGC TGCTGATCCA GCCGGTTTTT 
GCGCTGGCAG CGGTGCCCCC GGCCGGCGTG GACTACCGGA CTTTTGCCGT CACCGTGCAG 
GCCCCCGTGG TGGAGGAGTT CGCCAAGTCC TTGGGCCTGT TGCTACTGCT TGTGCTGGCG 
CGGAAGCACT TTGACGGCCC GGTGGACGGG GTGGTGTTCG CCTTCACCAT TGCCGGCGGC 
TTTGCTTTTA CGGAAAACAT CCTCTACTTC GGCCGGGCCA TCGCCGAGTC CGCAACACCG 
GGCACAGACC TCGCGGTCGT GTTCTTCCTG CGGGGCGTCA TGTCCCCGTT CGCCCACGCC 
ATCTTCACGG GTACCACCGG ACTCATTCTC GGTTTTGCGG CGCGGCGCTG GCACCCGGGG 
ATGTCCGTCG TTGCGTTCGC CGTGGGACTG GTCCCGGCGA TGATCCTGCA CAGTATGTGG 
AACAGCATGG GCCAGGACTT CCTGGTTCAG TACATCGTGG TCCAGGTGCC CATCTTCGTG 
CTGGCCGTCG TCGTTATTGT GCTGCTGCGT GTGGCGGAGA ACCGGCTAAC GCGGCAGCGG 
CTCCAGGAGT ATGCAGCCGC GGGGTGGTTC ACGCCGCCGG AAGTGGAGAT GCTGGCAACC 
GCCGGCGGAC GCCGTTCTGC GGTCCGCTGG GCGAAGCAGT TCGGCCGGGG GCCGCAGATG 
AAAGCCTTCC TGCGATCGGC CACCCGGCTT GCCTTCATCA GGCAACGGAT CCTCAGTGGC 
CGGGACGTTC CGGCCCACCA GCTGGACGAG CACCACCAGC TCGCAGAAGT CGTGGCCCGG 
CGGGACGCCG TGCTGCGCTA G

Protein sequence

MMPPAAVRSR SSAGVVGLVG GGGFLAFASL FLVLPYLVGN TGVTGFVIGF IASLIPLSAV 
LLAVYVIDRW EPEPKRLLLF AFMWGAVVSI SVTLLIQPVF ALAAVPPAGV DYRTFAVTVQ 
APVVEEFAKS LGLLLLLVLA RKHFDGPVDG VVFAFTIAGG FAFTENILYF GRAIAESATP 
GTDLAVVFFL RGVMSPFAHA IFTGTTGLIL GFAARRWHPG MSVVAFAVGL VPAMILHSMW 
NSMGQDFLVQ YIVVQVPIFV LAVVVIVLLR VAENRLTRQR LQEYAAAGWF TPPEVEMLAT 
AGGRRSAVRW AKQFGRGPQM KAFLRSATRL AFIRQRILSG RDVPAHQLDE HHQLAEVVAR 
RDAVLR