Gene Francci3_3569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3569
Symbol
ID	3904508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4266653
End bp	4267690
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	70%
IMG OID	637880890
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_482650
Protein GI	86742250
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0600] ABC-type nitrate/sulfonate/bicarbonate transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0917022
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACTG ACGTCAGCGT CTCCAGCGAT AAGAGTGTCC TGCTCGGCGA GGCGGGTAAG 
TCCTTCGACG TCGACACGGC CCTCGCCGGC CTCGACGCGC TGGACATCCC GACCGCGCAA 
CGGCGGCCGT TCGCGGTCCG CGTCTGGGCG GCCAGCTGGC CGAAGCTCGG CGCTCTGCTC 
CTGTTCCTGC TGCTCTGGCA GATCGTCGTC TGGAGTGGCT GGAAGCCCAG CTATGTGTTG 
CCCGGCCCGG GCGAGGCACT GGGCGAGTTC GTCGACCAGC TGGGCAGCGG ACACTTCTGG 
GACGCCCTCG CCCGCACCCT GGTCCGGGCC CTGGAGGGAT ACGCTCTCGC CGTGCTCATC 
GGCACCGTGG TCGGGATCGC GGTGTCCCGC TTCGGAGTCC TGCGTACCGC GGTGGGATCG 
TTCATCACCG CGGTGCAGAC GATGCCCTCG ATCGTCTGGT TCCCGCTCGC CGTCCTGCTG 
TTCAAGCTCA GCGAGTCCGC AATCATGTTC GTGGTGGTGC TCGGGGCGGC GCCCTCGGTG 
GCCAACGGCG TCATCTACGG CGTGGACTAC GTGCCGCCTC TGCTGGTCCA GGTCGGCCGC 
AGCATGGGCG CGCGTAGCCT GTCCCTCTAC CGGTACGTCG TGGTACCGGC GGCCCTGCCC 
TCGGTGCTCG CGGGCCTGAA GCAGGGCTGG GCGTTCGCTT GGCGCAGCCT GATGGCCGGC 
GAATTGCTGG TCATCGTTCC GGGGCATCCG TCCGTCGGAG CTGACCTGCA GAATGCCCGC 
GAACTACTCG ACACGGTCGG GGTACTGGCC TCGATGATCA CGATTTTCGT GATCGGGGTG 
CTCATCGACG CCGGGTTCAA CGCGGCGGAC CAGCGGATGC GGCAGCGCCG TGGGCTGGTT 
GCGGAGGGTA CGACGGCGGT CCGGGCAGCT CGGCGTCGCC GGAGCGGCAG CGCCGACGGG 
TCCGCCGCGG CCGCCACCAC GGCCACCTCC TCCGCCGGAG GCGGCACGGA CGCCCCCCGT 
CCCGAGAGGG CTGGCTGA

Protein sequence

MATDVSVSSD KSVLLGEAGK SFDVDTALAG LDALDIPTAQ RRPFAVRVWA ASWPKLGALL 
LFLLLWQIVV WSGWKPSYVL PGPGEALGEF VDQLGSGHFW DALARTLVRA LEGYALAVLI 
GTVVGIAVSR FGVLRTAVGS FITAVQTMPS IVWFPLAVLL FKLSESAIMF VVVLGAAPSV 
ANGVIYGVDY VPPLLVQVGR SMGARSLSLY RYVVVPAALP SVLAGLKQGW AFAWRSLMAG 
ELLVIVPGHP SVGADLQNAR ELLDTVGVLA SMITIFVIGV LIDAGFNAAD QRMRQRRGLV 
AEGTTAVRAA RRRRSGSADG SAAAATTATS SAGGGTDAPR PERAG