Gene Arth_2575 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2575
Symbol
ID	4444834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2891786
End bp	2892742
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	68%
IMG OID	639690394
Product	major intrinsic protein
Protein accession	YP_832054
Protein GI	116671121
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0580] Glycerol uptake facilitator and related permeases (Major Intrinsic Protein Family)
TIGRFAM ID	[TIGR00861] MIP family channel proteins

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.770584
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTCCC CCGTGCCTGC ACGCCAGACC ACAAGTCCCG ATTTGCGCTC CGCTCCGGAG 
GCTTTCACAC CCGGGCTTGC GGCACGTCTG TCGGCGGAGG CCTTTGGAAC CCTTTTCCTG 
GTGATCGCCG GACTGGGCGT GCCGCTGTTC ACGATTCCGC AGTCCAACCC GTTGTCCGCC 
TCGCTGGCCG CCGGGCTTGC CGTCACGGCC GCTATGCTCG CCTTCGCTTA TATCTCCGGC 
GGCCACTTCA ACCCGGCAGT GACCCTGGGC AACGCCATCG CGGGCCGCAT CAGGCTGCCG 
GAAGCTGCGG CGTACGTCGG CGCGCAGCTT GTCGGCGCCG CCGCCGGCAC CCTGGCACTG 
TTCGGAATCC TGCGAACGGT GCCCAAAATC GAAGACACCC GCGCCGCCTT TGACACCGTG 
ACGGCGGGCT TTGGCGAGCA TTCCATCATC CAGGCTCCCA TGGCCGGAGT CCTGCTCGTC 
GAGGTACTCG GCGCTGCGCT CCTGGTAGCC GTCTTCCTGG GGACCACAGC TGCCCGCAAC 
ACCAACAAAG CCGCAGCCCC CTTCGCGGTG GGACTCACGC TCGCCGTCCT GCTGCAGCTG 
GGGCAGGCCG TGGGCAACAC ACCGTTCAAT CCGGCGCGCG CCACCGCGTC GGCCATCTTC 
AGCAACACCT GGTCCCTCGA GCAGCTGTGG CTCTTCTGGG TGGCCCCGCT GGTGGGTGCC 
GCCATCGCGG GCCTTGTGTT CCGCGGGTTC GCCGACACCC CTGCGGCTGC TCCGTCCCCC 
GCCCAGGCGG ACGCCGACGA CGCTGCGCAC GAGTCCGATG ACGATCTGCA CGACGATGTT 
GACGATGACA CCACCGGTTT TGAAGGTGAC GCCGCCGGCC GCTCCGACGC GCCGGCTGCC 
GGCGCCTCTG CCAACGATGA CGTCCGGGAC TTCTTTGACG GCAAGCGCGG ACAGTAG

Protein sequence

MTSPVPARQT TSPDLRSAPE AFTPGLAARL SAEAFGTLFL VIAGLGVPLF TIPQSNPLSA 
SLAAGLAVTA AMLAFAYISG GHFNPAVTLG NAIAGRIRLP EAAAYVGAQL VGAAAGTLAL 
FGILRTVPKI EDTRAAFDTV TAGFGEHSII QAPMAGVLLV EVLGAALLVA VFLGTTAARN 
TNKAAAPFAV GLTLAVLLQL GQAVGNTPFN PARATASAIF SNTWSLEQLW LFWVAPLVGA 
AIAGLVFRGF ADTPAAAPSP AQADADDAAH ESDDDLHDDV DDDTTGFEGD AAGRSDAPAA 
GASANDDVRD FFDGKRGQ