Gene Arth_4102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4102
Symbol
ID	4447692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4623211
End bp	4624284
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	68%
IMG OID	639691933
Product	hypothetical protein
Protein accession	YP_833577
Protein GI	116672644
COG category	[R] General function prediction only
COG ID	[COG5006] Predicted permease, DMT superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCTGCCG CAAGCAAACG CGCCGATGCG TCCTTCCAGG GCGCCGCGCC CAGGGTCGGC 
GCCCCCCGCC GGCCGGCTGC CGGGTTCCTG GCATCCGGGC TCGGCGTGGC GCTATTCTCT 
TCAGCCGTCT TCGGCCTTTC CGGATCTTTT GCCAAGGCCC TGCTCGAAAC CGGGTGGACT 
CCGGGTGCGG CCGTGACCGC GCGCCTGACC GGGGCAGCCC TCATCCTCGC GATCCCGGCA 
GTGCCCGCAC TGCACGGCCG CTGGCGCCAG CTGAGGGACA ACTGGCTGAC CATCCTGCTG 
TTCGGGCTCA TCGGGGTCGC AGCCTGCCAG CTGTTCTACT TCAACGCCGT CGAGCGGCTC 
TCCGTGGGCG TTGCCCTGCT GCTGGAGTAC CTGGCCCCGG TGATCATCGT CCTCTGGCTG 
TGGGCCGCGA GCCGACGGCG TCCGCGCCCG CTCACCATTG CGGGAACGCT GCTTTCGCTG 
GGCGGACTCA TCCTGGTGCT GGACCTTACC GGTGCCGTGA AGATCGACGT CGTCGGCGTC 
CTGTGGGGAG TCGCCGCAGC CGTCTGCCTG GCGATCTATT TCTTCATCAC TGCAAAGGAA 
AATGACACCC TCCCGCCGAT CGTCCTCGCA TCCGGCGGCC TGATGGTGGG CGCCGTGGTG 
ATGTGGCTGG CGGCTGCCAC CGGACTTCTG CCGATGGCGT TCAGCACGGC GGACACCAAA 
CTGGGGCCGT GGGTCACACC GTGGTGGGTT TCGCTGGGCG GCCTAATCAT CCTTGCCACG 
GTCCTCGCGT ACGTCTCGGG CATCGTTGCC GCGCGGGCGC TCGGTTCAAA GGTTGCATCA 
TTCGTGTCGC TCACCGAGGT GCTTTTCGCC GTCATCTGGG CGTGGCTCCT GCTCGGTGAA 
CTGCCCGGTC CTATCCAGCT CCTCGGCGGT GTGCTGATTG TTGGCGGCGT CGTTCTGGTC 
CGCGTGGACG AGCTCCGCGG GCCGCGGGTA GCGCCGGCCT CTTCAGGCGG ACCCGGTGCA 
GCGCCGGTGC CGGCGCCGCT GGACCACGCG AACGACGTCG AACCCGTCCC CTAA

Protein sequence

MPAASKRADA SFQGAAPRVG APRRPAAGFL ASGLGVALFS SAVFGLSGSF AKALLETGWT 
PGAAVTARLT GAALILAIPA VPALHGRWRQ LRDNWLTILL FGLIGVAACQ LFYFNAVERL 
SVGVALLLEY LAPVIIVLWL WAASRRRPRP LTIAGTLLSL GGLILVLDLT GAVKIDVVGV 
LWGVAAAVCL AIYFFITAKE NDTLPPIVLA SGGLMVGAVV MWLAAATGLL PMAFSTADTK 
LGPWVTPWWV SLGGLIILAT VLAYVSGIVA ARALGSKVAS FVSLTEVLFA VIWAWLLLGE 
LPGPIQLLGG VLIVGGVVLV RVDELRGPRV APASSGGPGA APVPAPLDHA NDVEPVP