Gene Arth_4149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4149
Symbol
ID	4447617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4671586
End bp	4672671
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	68%
IMG OID	639691980
Product	hypothetical protein
Protein accession	YP_833624
Protein GI	116672691
COG category	[V] Defense mechanisms
COG ID	[COG0577] ABC-type antimicrobial peptide transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTTCTCG CTATTCGCGA TCTCCGCTTT GCCAAAGGAC GCTTTGCCCT GATGGCAGCC 
GTTATCGCCC TGATCACCTT GTTGCTCGTG ATGCTCTCTG GCCTCACCGC CGGTTTGGGA 
AACCAGTCGA CGTCGGCAAT CACCGCGCTG CGGGCCGACC AGATCGTGTT CGGAGCCCCC 
GCCGGCACTC CGGCCAAGGC ATCCTTCACC GAATCGGAAG TGAGCCGCGA CCAGCTGGCC 
GCCTGGTCGG GACGGGACGG GGTTTCGGGG GTGGAGGCGC TCGGCATCAG CCAGGCCCGC 
GCTCAGGCCG TTGGCCCCGC CGGAGCCCCG GGCGGCACCG CAAACGTGGC CGTCTTCGGA 
TCCGGAAACG GAAACTCGGG GGACCCGGAG GACGGAACAG TAGTGGTGGG CGAAACCCTC 
GCTGCGGACC TGCACCTGAG CCCCGGCAGC CGCCTTGCGG TGGGCGGGGC GGAACTTGCC 
GTTGCGGACA TCGTCCCGGA CGAGTGGTAC TCGCATACCG GCGTCATCTG GACGTCGCTG 
AACGACTGGC GGCAATTGGC CCGCGCAGGC AACGGATCAC TCGGCACCGT GCTGGCCGTA 
ACGTTCGACG CCGGCGCCCG GGTTGACGTG GACGCCGCCA ACGCGGCGGC GGGAACAGTC 
AGCGCCACCC GTGAAGGCTC GTTCCAGGCG CTGGGGTCGT TCAAAAGCGA AAACGGCTCG 
CTGGTGCTGA TGCAGGCGTT CCTGTACGGC ATCTCGGCCC TGGTGATCGT GGCGTTCCTG 
ACGGTATGGA CTGTTCAGCG GACCCGCGAC ATTGCCGTCG TCAAGGCAAT GGGCGGGTCC 
CCGGGGTATG TGCTCCGCGA TGCGATGGCG CAGGCCGGGA TGGTGCTGGC AGCAGGGACG 
GTTACCGGCG GCGGAGCAGG ACTGCTCGGC GGGATTTTTG CGGCACAGGC TGCCCCGTTC 
CTGGTCACAC CGGACACCAC GCTCGTTCCC ATTGCCGGAA TCCTGCTCCT GGGCCTCAGC 
GGAGCCGTCG TGGCGGTCCG CGGCGTTACC CGGGTTGACC CGCTACTTGC CCTCGGCGGC 
AACTGA

Protein sequence

MFLAIRDLRF AKGRFALMAA VIALITLLLV MLSGLTAGLG NQSTSAITAL RADQIVFGAP 
AGTPAKASFT ESEVSRDQLA AWSGRDGVSG VEALGISQAR AQAVGPAGAP GGTANVAVFG 
SGNGNSGDPE DGTVVVGETL AADLHLSPGS RLAVGGAELA VADIVPDEWY SHTGVIWTSL 
NDWRQLARAG NGSLGTVLAV TFDAGARVDV DAANAAAGTV SATREGSFQA LGSFKSENGS 
LVLMQAFLYG ISALVIVAFL TVWTVQRTRD IAVVKAMGGS PGYVLRDAMA QAGMVLAAGT 
VTGGGAGLLG GIFAAQAAPF LVTPDTTLVP IAGILLLGLS GAVVAVRGVT RVDPLLALGG 
N