Gene Arth_3372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3372
Symbol
ID	4444101
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3789243
End bp	3790544
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	69%
IMG OID	639691195
Product	type II secretion system protein E
Protein accession	YP_832847
Protein GI	116671914
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACGC TTCCACAGAT GCCGGGTGCG TCCCGGTTTC CCGGGCCGGC CGGCGGCCTT 
AGGCGGCGGC AGAACAGTGC ACTGGACGCC GGGCTGCTCG AATCCGTCCG CGAATCAGTG 
ATGGCCGATT CCGGTCCGGT GACCCCCTCC CGGGTGGCCG CGGCCGTTCA GGCCACGGGA 
AGGCTCCTGG GCACGGCGGG GTCGCTGGCC GCCGTCGAAC GGATCAGCGC AGAGCTCAAC 
GGTCTGGGAC CGCTGCAGGT GCTGACCAGG GATCCGTCCG TAACGGACAT CTTCGTCAAC 
GCCCCGGACT CCGTCTGGCT GGACCGCGGA AACGGCCTGG AGCAGGCGGC GGTGTCGTTC 
TCCTCCGAAA GCGAGGTACG TTCGCTGGCG GCCCGCCTCG TGGCGGCAGG CGGGCGGCGT 
CTGGACGACG GATCCCCGTG CGTCGATGTC AGGCTTGAGG CCGGATACCG GGTCCACGCA 
GTCCTGCCGC CGATCTCGAC AGCCGGGACG CTGTTGAGCG TCAGAATCCG CCGTCACGAG 
GTGTTCACGC TGGACGAGCT CCGGGACGGC GGCATGTTTG GTTCTTTGGT CCAGGACGTA 
CTGGAACGCG TGGTTTCCCG GCGTCTGAGC TTCCTGGTCA GCGGTGCCAC CGGGTCAGGG 
AAGACCACCC TCCTCTCAAC ACTCCTGGGG CTGAGCGAGC CTGGCGAACG GCTCGTCCTG 
ATCGAGGATG CTTCCGAACT GAACCCCGTC CATCCGCACG TGGTGTCACT TGAGTCGAGG 
CACGGAAACC TTGAAGGCGG CGGTGCGGTG GACCTCGCCG AACTGGTACG GCAGGCCCTC 
CGAATGAGAC CTGACCGCCT GGTGGTGGGG GAATGCCGCG GAGCCGAGGT CCGCGAACTG 
CTGACGGCTA TGAATACCGG ACACACCGGG GGCGGCGGAA CGATCCACGC GAACACGGCT 
GCCGCCGTGC CTGCCCGCCT CACGGCGCTC GGCGCCCTTG CCGGAATGGG TCAGGACGCC 
ATGCGGCTGC AGGTTGCCAG CGCTTTGGAC GTTGTGGTCC ACGTGGAGCG TTCCCGCGGC 
ATCCGTCAGG TGGCCTGCAT CGGGTTGGTT GAAGACGGCC CGCTCGGACT GGAAGTCTCG 
GCGGCCGTGG CTGTGCAGGC GGGTACCGTC ACCCTGGGAC CCTCCTGGCC GAGGCTTGCG 
CGAAGACTGG GCATTGATGC TTCCGGCGCC GCAAACCCCG GCGCCGCGGA CCCCGGCCAG 
GCAGCCACCG GTGCCGGACC CCTGAGTCCA GTGCACAGGT GA

Protein sequence

MSTLPQMPGA SRFPGPAGGL RRRQNSALDA GLLESVRESV MADSGPVTPS RVAAAVQATG 
RLLGTAGSLA AVERISAELN GLGPLQVLTR DPSVTDIFVN APDSVWLDRG NGLEQAAVSF 
SSESEVRSLA ARLVAAGGRR LDDGSPCVDV RLEAGYRVHA VLPPISTAGT LLSVRIRRHE 
VFTLDELRDG GMFGSLVQDV LERVVSRRLS FLVSGATGSG KTTLLSTLLG LSEPGERLVL 
IEDASELNPV HPHVVSLESR HGNLEGGGAV DLAELVRQAL RMRPDRLVVG ECRGAEVREL 
LTAMNTGHTG GGGTIHANTA AAVPARLTAL GALAGMGQDA MRLQVASALD VVVHVERSRG 
IRQVACIGLV EDGPLGLEVS AAVAVQAGTV TLGPSWPRLA RRLGIDASGA ANPGAADPGQ 
AATGAGPLSP VHR